Ketvirtadienis, 24 birželio, 2021

Kaip atpažinti tekstą?

Šiais laikais, kai didžioji dalis duomenų yra perkeliamos į elektroninę formą ir talpinamos internete, tenka susidurti su situacijomis, kai tam tikrus tekstus, aš rašytinę informaciją galime rasti tik skenuotų dokumentų arba nuotraukų pavidalu. Ir jei ši informacija yra reikalinga redaguojamoje formoje, tenka pasukti galva kaip gi tai padaryti greičiau ir patogiau. Žinoma, jei tektas nėra ilgas, arba jus domina tik keli sakiniai, tai paprasčiausias, būdas yra tiesiog perrašyti viską į bet kurį tekstinį redaktorių, tokį kaip Microsoft Word. Tačiau jei kalba eina apie kelių ar net keliolikos puslapių straipsnį ar knygą, tai rankinis darbas gali užtrukti ne viena dieną, o ir norinčių jį atlikti turbūt neatsiras labai daug. Tokiomis situacijomis į pagalba ateina šiuolaikinės technologijos, o tiksliau specialios programos, kurios ne tik pagreitina darbą, bet ir laidžia patiems spręsti kokioje formoje turėtų būti nuskaitomi skirtingi duomenys.

Tekstų atpažinimo programos veikia OCR (Optical Character Recognition) technologijų pagrindu. Šio technologijos yra nukreiptos į spausdinto teksto, tiksliau ženklų ir žodžių atpažinimą ir jų konvertavimą į redaguojamą, elektroninę versiją. Viena žinomiausių programinių įrangų, kuri naudoja šias technologijas tam, kad palengvinti kasdienius darbus yra Abbyy FineReader, apie ją galima daugiau sužinoti čia https://www.distributor.lt/biuro-programos/abbyy-finereader-programa/categories.aspx?CatID=3697. OCR programų panaudojimas gali būti labai platus ir apima tokius darbus:

  • Verslo dokumentų duomenų suvedima. Jos gali padėti greitai perkelti tam tikrus duomenis iš tokių dokumentų kaip pasai, čekiai ar sąskaitos.
  • Vizitinių kortelių duomenų nuskaitymas ir perkėlimas į duomenų bazes.
  • Skenuotų knygų ir dokumentų konvertavimas į redaguojamas versijas.
  • Netgi automobilių numerių ir kelio ženklų atpažinimui.
  • Suteikiant galimybę ieškoti informacijos skenuotose dokumentuose.

Paskutinės naujienos