Tesseract 5.3.4: Un salt înainte în recunoașterea optică a textului

Este disponibilă o nouă versiune punctuală a Tesseract 5.3.4 OCR cu îmbunătățiri.

Tesseract OCR este o aplicație gratuită și un standard pentru majoritatea cazurilor de utilizare OCR. Cea mai recentă versiune, Tesseract 5.3.4, este setată pentru a îmbunătăți și munca OCR cu o serie de îmbunătățiri cheie. Sponsorizat de Google din 2006, Tesseract a parcurs un drum lung de la dezvoltarea sa inițială de către Hewlett Packard între 1985 și 1998, evoluând într-unul dintre cele mai avansate sisteme OCR de pe piață.

Tesseract oferă două motoare de recunoaștere distincte: motorul clasic, care identifică textul la nivelul modelelor de caractere individuale, și un motor nou care utilizează învățarea automată, în special o rețea neuronală recurentă cu memorie pe termen scurt (LSTM). Acest motor avansat optimizează recunoașterea șirurilor de caractere, ceea ce duce la o creștere remarcabilă a acurateței. Disponibilitatea modelelor gata pregătite pentru 123 de limbi simplifică și mai mult experiența utilizatorului.

Tesseract 5.3.4: Puncte cheie

Suport UTF-8 și capacități multilingve

Tesseract 5.3.4 introduce caracteristici cheie care îi sporesc capacitatea de utilizare într-o multitudine de limbi. Sistemul suportă acum recunoașterea caracterelor UTF-8 și a textelor în peste 100 de limbi, de la cele vorbite pe scară largă, cum ar fi engleza și spaniola, până la limbi cu scripturi unice, cum ar fi rusă, kazahă, belarusă și ucraineană. Această actualizare se adresează unei baze globale de utilizatori, făcând din Tesseract o alegere versatilă pentru diverse nevoi lingvistice.

Mai multe formate de ieșire

Una dintre caracteristicile remarcabile ale Tesseract a fost întotdeauna adaptabilitatea sa, iar versiunea 5.3.4 face un pas înainte. Utilizatorii își pot salva acum rezultatele OCR în diverse formate, inclusiv text simplu, HTML (hOCR), ALTO (XML), PDF și TSV. Această flexibilitate asigură faptul că utilizatorii pot integra fără probleme Tesseract în fluxurile lor de lucru existente, adaptându-se cu ușurință la diferitele cerințe ale proiectelor.

Optimizarea performanței

Tesseract 5.3.4 nu se oprește doar la îmbunătățirea funcțiilor, ci utilizează tehnologii moderne pentru a optimiza performanța. Includerea modulelor care utilizează OpenMP și instrucțiuni SIMD precum AVX2, AVX, AVX512F, NEON sau SSE4.1 asigură utilizatorilor o recunoaștere rapidă și eficientă a textului.

Key Improvements in Tesseract 5.3.4:

  1. Recunoașterea îmbunătățită a imaginilor prin URL: Noua versiune îmbunătățește recunoașterea imaginilor prin permiterea descărcărilor de fișiere pe bază de URL folosind biblioteca libcurl. Această caracteristică permite o mai mare flexibilitate și ușurință în utilizare, antetul User-Agent fiind setat în timpul încărcării. O adăugare notabilă este parametrul "curl_cookiefile" pentru utilizarea unui fișier cookie.
  2. Protocolul TCP pentru serverul ScrollView: Serverul ScrollView preferă acum protocolul TCP, ceea ce sporește eficiența comunicării.
  3. Experiența utilizatorului îmbunătățită: Comanda "combine_tessdata -d" a fost rafinată pentru a oferi ieșire pe stdout în loc de stderr, îmbunătățind experiența generală a utilizatorului.
  4. Corectarea problemelor de compilare: Tesseract 5.3.4 rezolvă problemele de compilare atunci când se utilizează autoconf și clang, asigurând un proces de instalare mai ușor.
Tesseract 5.3.4
Tesseract 5.3.4

În timp ce Tesseract continuă să stabilească noi repere în tehnologia OCR, versiunea 5.3.4 îi consolidează poziția de lider, ca soluție open-source. Această versiune ar trebui să ajungă în Ubuntu, Debian și în alte depozite de distribuție în câteva zile.

Puteți descărca această versiune de pe pagina oficială.

Sursa: https://debugpointnews.com/tesseract-ocr-5-3-4/

Comentarii

Postări populare de pe acest blog

BlueOS: Un sistem de operare care folosește Rust și acceptă Linux

Google propune utilizatorilor computerelor mai vechi cu Windows 10 să migreze la ChromeOS Flex — 600 de dispozitive certificate

Tocmai a fost lansat /e/OS 1.17, aducând un val de îmbunătățiri, de la măsuri de confidențialitate îmbunătățite la o interfață de utilizator reproiectată.