The Lemur Toolkit.

Pemodel Bahasa Gratis untuk Mac OS X
Unduh sekarang

The Lemur Toolkit. Peringkat & Ringkasan

Iklan

  • Rating:
  • Lisensi:
  • Freeware
  • Harga:
  • FREE
  • Nama Penerbit:
  • The Lemur Team
  • Situs web penerbit:
  • http://www.lemurproject.org/
  • Sistem operasi:
  • Mac OS X
  • Ukuran file:
  • 63.2 MB

The Lemur Toolkit. Tag


The Lemur Toolkit. Keterangan

Pemodel Bahasa Gratis untuk Mac OS X Lemur Toolkit dirancang untuk memfasilitasi penelitian dalam pemodelan bahasa dan pengambilan informasi, termasuk teknologi seperti ad hoc dan pengambilan yang didistribusikan, ringkasan, IR, penyaringan, dan klasifikasi. Apa yang baru dalam rilis ini: · 4.9 mengoreksi berbagai masalah dalam paket distribusi 4.8, memberikan yang baru · FileClassesenvironmonment untuk input file warc, berbagai kecepatan pengindeksan · Optimalisasi untuk Indri; dan banyak lagi. · Aplikasi yang dikompilasi dengan Lemur Toolkit memerlukan yang berikut ini · Perpustakaan: Z, Iberty, PThread, dan M di Linux, dan juga soket · Dan NSL di Solaris. Aplikasi yang dibangun di studio visual membutuhkan · Perpustakaan tambahan wsock32.lib. File Java Jar dibangun dengan · Java 5 (JDK 1.5.0). Java UIS memerlukan Java 5. Kami telah diuji menggunakan GCC · 3.2 (Solaris), 3.2.2 (Linux), 3.4 (Linux), 3.4.3 (Linux x86_64), 4.0.2 (Linux), · 4.3.1 (OS / X), VC ++ .NET 7.1 (Windows XP), dan Visual Studio 2005 (Windows · XP). Peningkatan: · Kendala LayoutManager telah dimodifikasi untuk meningkatkan ukuran · Perilaku komponen. · Bilah Alat Log Kueri dan Server mendukung Pengunggahan Otomatis Log · File berdasarkan yang dijadwalkan. Preferensi ini dapat diatur oleh pengguna · Bilah alat untuk sepenuhnya otomatis, otomatis dengan konfirmasi diperlukan · Sebelum mengunggah, atau hanya mengunggah secara manual. · Perangkat FileClassesen Baru, Warc, telah ditambahkan ke Indri. Lingkungan ini · Memungkinkan pengindeksan Corpus Clueweb09, · Http: //boston.lti.cs.cmu.edudata/clueweb09/ · Pengindeksan Indri Pengindeksan Kecepatan, Menyediakan SpeedUp 5-15% untuk GOV2 (25 Million Documents) Koleksi berukuran: · 1) Kurangi jumlah alokasi memori / deallocations di · Indeks :: _ LookupterMid. · 2) Gunakan opsi tabel lengkap, -cf, dari Flex. · 3) Jangan lakukan normalisasi kasus ASCII di · Utf8casenenormalizationtransformasi, seperti yang redundan. · 4) Gunakan hash_set dari STL, bukan string_set untuk stopwords. · 5) Jika jumlah yang dihapus adalah 0 di deleteddocumentlist, jangan mendapatkan baca · Kunci sebelum mengembalikan false. · 6) Gunakan trim, bukan bergabung, di repositoriMainancethread, untuk · Mengurangi angka-indeks sementara yang disalin. Berhenti mengumpulkan trim. · Kandidat ketika indeks dua kali ukuran indeks sebelumnya adalah · Ditemui. · 7) Ambil ukuran diskindex ke akun saat memperkirakan memori · penggunaan. · 8) Batasi jumlah total memori yang digunakan untuk cache panjang dokumen hingga 20MB · (5.000.000 dokumen).


The Lemur Toolkit. Perangkat Lunak Terkait

udt.

Aplikasi gratis untuk mendistribusikan protokol aplikasi melalui jaringan ...

331 109 KB

Unduh

Bakker.

Mudah menggunakan alat berbasis Ruby untuk mengganti nama dan menyalin file untuk cadangan ...

164 25 KB

Unduh

WFYD.

Program Pelacakan Waktu Gratis dan Sederhana untuk Mac Anda ...

210 206 KB

Unduh