მივესალმები ბლოგის ყველა მკითხველს!
მე ვფიქრობ, რომ ისინი, ვინც ხშირად ვმუშაობ კომპიუტერში (არ თამაშობენ, მაგრამ მუშაობს), უნდა გაეცნოთ ტექსტის აღიარებას. კარგად, მაგალითად, თქვენ წიგნიდან ამონაწერი ამოიღე და ახლა ეს დოკუმენტი შენს დოკუმენტში ჩასვათ. მაგრამ დასკანერებული დოკუმენტი სურათს წარმოადგენს და ჩვენ გვჭირდება ტექსტი - ამისათვის საჭიროა სპეციალური პროგრამები და ონლაინ მომსახურება სურათების ტექსტის დასადგენად.
ცნობის შესახებ პროგრამების შესახებ, უკვე წინა სტატიებში დავწერე:
- სკანირების ტექსტი და აღიარება FineReader- ში (ფასიანი პროგრამა);
- ანალოგი FineReader - CuneiForm (უფასო პროგრამა).
ამავე სტატიაში მინდა ხაზი გავუსვა ონლაინ სერვისებს ტექსტის აღიარებისთვის. ყოველივე ამის შემდეგ, თუ თქვენ გჭირდებათ სწრაფად მიიღოთ ტექსტი 1-2 სურათებით - აზრი არ აქვს, რომ სხვადასხვა პროგრამების დაყენების შეგრძნება ...
მნიშვნელოვანია! აღიარების ხარისხი (შეცდომების რაოდენობა, კითხვა და ა.შ.) დამოკიდებულია ორიგინალური გამოსახულების ხარისხზე. ამიტომ, როდესაც სკანირება (ფოტოსურათი და ა.შ.), შეარჩიეთ ხარისხი რაც შეიძლება მაღალი. უმეტეს შემთხვევაში, 300-400 dpi- ის ხარისხი საკმარისი იქნება (dpi არის სურათის ხარისხის დამახასიათებელი პარამეტრი, თითქმის ყველა სკანერის პარამეტრებში, ეს პარამეტრი ჩვეულებრივ მითითებულია).
ონლაინ მომსახურება
სამსახურების მუშაობის შესასრულებლად, ჩემი სტატიების ერთ-ერთი ეკრანი გავაკეთე. ეს სკრინშოტი ატვირთული იქნება ყველა სერვისზე, რომლის აღწერაც წარმოდგენილია ქვემოთ.
1) //www.ocrconvert.com/
მე ძალიან მომწონს ეს მომსახურება მისი სიმარტივის გამო. მიუხედავად იმისა, რომ საიტი ინგლისურია, ის კარგად მუშაობს რუსულ ენაზე. თქვენ არ გჭირდებათ რეგისტრაცია. აღიარების დასაწყებად, თქვენ უნდა გააკეთოთ 3 ნაბიჯი:
- ატვირთეთ თქვენი სურათი;
- აირჩიეთ ტექსტის ენა, რომელიც არის სურათში;
- დააჭირეთ ღილაკს აღიარების ღილაკს.
ფორმატი მხარდაჭერა: PDF, GIF, BMP, JPEG.
სურათზე ნაჩვენებია შედეგი. მე უნდა ვთქვა, რომ ტექსტი კარგად არის ცნობილი. გარდა ამისა, ძალიან სწრაფად - მე დაელოდა სიტყვასიტყვით 5-10 წამში.
2) //www.i2ocr.com/
ეს სამსახური ზემოთ მოყვანილია ზემოთ. აქ ასევე უნდა ჩამოტვირთოთ ფაილი, აირჩიეთ აღიარების ენა და დააჭირეთ ამონაწერი ტექსტის ღილაკს. სერვისი ძალიან სწრაფად მუშაობს: 5-6 წამი. ერთი გვერდი.
მხარდაჭერილი ფორმატები: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
ამ ონლაინ სერვისის შედეგი ბევრად უფრო მოსახერხებელია: თქვენ დაუყოვნებლივ იხილოთ ორი ფანჯარა - პირველში აღიარების შედეგი, მეორე - ორიგინალური იმიჯი. ამიტომ, ადვილია რედაქტირებისას რედაქტირების დროს რედაქტირება. რეგისტრაცია სამსახურში, სხვათა შორის, ასევე არ არის აუცილებელი.
3) //www.newocr.com/
ეს სერვისი უნიკალურია რამდენიმე გზით. პირველი, იგი მხარს უჭერს "მოძველებული" ფორმატის DJVU (სხვათა შორის, სრული სია ფორმატების: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). მეორე, ის მხარს უჭერს სურათების ტექსტის შერჩევას. ეს არის ძალიან სასარგებლო, როდესაც თქვენ გაქვთ სურათში არა მხოლოდ ტექსტი ადგილებში, არამედ გრაფიკული პირობა, რომ თქვენ არ უნდა აღიაროს.
აღიარების ხარისხი საშუალოზე მაღალია, არ საჭიროებს რეგისტრაციას.
4) //www.free-ocr.com/
ძალიან მარტივი მომსახურება აღიარებისათვის: ატვირთეთ სურათი, დააკონკრეტეთ ენა, ჩაწერეთ captcha (სხვათა შორის, ამ სტატიაში ერთადერთი სერვისი, სადაც ამის გაკეთება გჭირდებათ) და დააჭიროთ ღილაკს ტექსტის თარგმნა. სინამდვილეში ყველაფერი!
მხარდაჭერილი ფორმატები: PDF, JPG, GIF, TIFF, BMP.
აღიარების შედეგი საშუალოა. არსებობს შეცდომები, მაგრამ არა ბევრი. თუმცა, თუ ორიგინალური სკრინშოტის ხარისხი უფრო მაღალი იქნებოდა, უფრო ნაკლები შეცდომები იქნებოდა.
PS
ეს ყველაფერი დღესაც არის. თუ თქვენ უფრო მეტად იცნობთ საინტერესო ტექსტს ტექსტის ამოცნობისთვის - კომენტარების გაზიარება, მადლობელი ვიქნები. ერთი პირობა: სასურველია, რომ დარეგისტრირება არ არის საჭირო და სერვისი თავისუფალი იყო.
საუკეთესო სურვილებით!