Proyek Lemur.

Aplikasi Pemodelan Bahasa dan Pengambilan Informasi
Unduh sekarang

Proyek Lemur. Peringkat & Ringkasan

Iklan

  • Rating:
  • Lisensi:
  • Freeware
  • Harga:
  • FREE
  • Nama Penerbit:
  • The Lemur Team
  • Situs web penerbit:
  • http://www.lemurproject.org/
  • Sistem operasi:
  • Mac OS X
  • Ukuran file:
  • 63.6 MB

Proyek Lemur. Tag


Proyek Lemur. Keterangan

pemodelan bahasa dan aplikasi pencarian informasi Lemur Toolkit adalah aplikasi gratis dan open source yang dirancang untuk memudahkan penelitian dalam pemodelan bahasa dan pencarian informasi. Lemur Toolkit termasuk teknologi seperti ad hoc dan pengambilan didistribusikan, IR lintas bahasa, summarization, penyaringan, dan klasifikasi. Berikut adalah beberapa fitur kunci dari "The Lemur Project": · Canggih bahasa query terstruktur (menggunakan inquery dan Indri) · Dukungan untuk XML dan pengambilan dokumen terstruktur · Digunakan umumnya dengan berbagai koleksi uji penelitian (misalnya, TREC CD 1-5, wt10g, RCV1, gov, gov2) · Indeks halaman web Anda dengan "out-of-the-box" kemampuan penelusuran situs · Antarmuka Interaktif untuk Windows, Linux, dan Web · Distributed pencarian informasi dan dokumen aplikasi pengelompokan · Cross-platform, cepat dan kode modular yang ditulis dalam C ++ · C ++, Java dan C # API · Gratis dan open-source software · Dalam penggunaan selama lebih dari 6 tahun oleh komunitas pengguna yang besar dan berkembang pengindeksan: · Metode pengindeksan Beberapa untuk skala besar kecil, menengah dan (terabyte) koleksi · Built-in mendukung untuk bahasa Inggris, Cina dan teks Arab · Porter dan Krovetz kata yang berasal · Incremental pengindeksan · Out-of-the-box dukungan pengindeksan untuk TREC Text, TREC Web, teks biasa, HTML, XML, PDF, MBox, Microsoft Word, dan Microsoft PowerPoint · Indeks inline dan anotasi teks offset (misalnya, bagian-of-speech dan diberi nama entitas) · Atribut dokumen Indexes Retrieval: · Mendukung pemodelan bahasa utama pendekatan seperti Indri dan KL-perbedaan, serta ruang vektor, tf.idf, Okapi dan inquery · Relevance- dan pseudo-relevansi umpan balik · Wildcard ekspansi jangka (menggunakan Indri) · Ayat dan elemen XML pengambilan · Cross-lingual pengambilan · Smoothing melalui prior Dirichlet dan rantai Markov · Mendukung sewenang-wenang prior dokumen (misalnya, Page Rank, kedalaman URL) Apa yang baru dalam rilis ini: · 2799440 terminfo dikembalikan oleh IndriTermInfoList tidak memiliki posisi · 2794361 harvestlinks gagal untuk membuat direktori panen · 2788507 KrovetzStemmerTransformation dapat meluap penyangga · 2788504 AnchorTextAnnotator dapat meluap penyangga · 2787935 pagerank kesedihan inti jika link jalan buruk · 2784994 Artikel Salah · 2783665 TextTokenizer prematur berakhir atribut tag dikutip · 2782954 indri :: parse :: HTMLParser :: handleTag dapat meluap buffer · 2772914 irevalGUI.jar memberikan hasil yang gila · 2772846 bin / ireval.jar adalah file .JAR tidak valid (Lemur v48) · 2770916 documentLength penyangga korupsi dengan beberapa benang · 2747981 WARCDocumentIterator merindukan dokumen dalam file WARC · 2747707 TextTokenizer tidak mengenali beberapa atribut tag dikutip


Proyek Lemur. Perangkat Lunak Terkait

Findbin.

Aplikasi Haskell untuk menemukan direktori program asli ...

158 2 KB

Unduh

Scdoc.

Utilitas baris perintah gratis dan open source yang akan membantu Anda membuat, mengekstrak, dan memverifikasi dokumentasi tertanam ...

206 105 KB

Unduh