| Tesseract-ocr. Mesin OCR yang dikembangkan di HP Labs antara 1985 dan 1995 dan sekarang di Google |
Unduh sekarang |
Tesseract-ocr. Peringkat & Ringkasan
- Nama Penerbit:
- theraysmith
- Sistem operasi:
- Windows XP / Vista / 7
Tesseract-ocr. Tag
Tesseract-ocr. Keterangan
Edit dengan TesserAct mungkin adalah mesin OCR open source paling akurat. Dikombinasikan dengan LePtonica Image Processing Library Ini dapat membaca berbagai macam format gambar dan mengubahnya menjadi teks dalam lebih dari 60 bahasa. Itu adalah salah satu dari 3 mesin teratas dalam uji akurasi UNLV 1995. Antara 1995 dan 2006 itu memiliki sedikit pekerjaan yang dilakukan di atasnya, tetapi sejak itu telah ditingkatkan secara luas oleh Google. Catatan Rilis Tesseract 23 Okt 2012 - v3.02.02 - Terpindahkan Resultatorator / Porporator ke CCMAIN. - Menambahkan kemampuan kanan ke kiri / bidi di iterator output untuk Ibrani / Arab. - Menambahkan deteksi paragraf dalam analisis tata letak / pos OCR. - Memperbaiki XHEight yang tidak konsisten selama pelatihan dan pemotongan berlebih. - Menambahkan kemampuan multi-bahasa simultan. - Modul pengenalan kata tingkat atas yang dapat di refactored. - Menambahkan detektor persamaan eksperimental. - Peningkatan penanganan resolusi dari input gambar. - Modul Blamer ditambahkan untuk analisis kesalahan. - Membersihkan namespace bekas eksternal dengan menghapus termasuk dari Baseapi.h. - Kode manajemen memori mati yang dihapus. - Kendala merapikan pada parameter kontrol. - Menambahkan dukungan untuk shapetable dalam classifier dan pelatihan. - PROUNER KELAS REFACTORED. - Kebocoran dan keacakan pelatihan tetap. - Perbaikan besar pada analisis tata letak untuk deteksi gambar yang lebih baik, deteksi diakritik, temuan teks yang lebih baik, temuan tabstop yang lebih baik. - Peningkatan deteksi dan penghapusan garis. - Menambahkan chopper pitch tetap untuk CJK. - Menambahkan Unicharset ke Werd_choice untuk membuat penanganan berbahasa multi lebih mudah. - Memperbaiki masalah dengan gambar skala internal. - Tambah halaman dan Bbox untuk string dalam file tr untuk mengidentifikasi sumber data pelatihan dengan lebih baik. - Perbaikan untuk Splitter Shiroreka Hindi. - Tambah kata koreksi bigram. - Mengurangi konsumsi memori tumpukan dan menghilangkan beberapa juru ketik jelek. - Menambahkan API Classifier Seragam Baru. - Menambahkan penghitung kesalahan pelatihan baru. - Memperbaiki bug endian di dawg reader. - C API (Terima kasih kepada Tobias Müller) - Solusi Baru untuk VS 2008 (Terima kasih kepada Tom Powers) - Dan ...
Tesseract-ocr. Perangkat Lunak Terkait