ყოველთვის არ არის შესაძლებელი ტექსტის ამონაწერი PDF ფაილის გამოყენებით ჩვეულებრივი კოპირება. ხშირად ასეთი დოკუმენტების გვერდებია ქაღალდის ვერსიების დასკანირებული შინაარსი. ასეთ ფაილებს სრულად რედაქტირებადი ტექსტური მონაცემების გარდაქმნა, სპეციალური პროგრამების გამოყენება ოპტიკური სიმბოლოების აღიარებასთან (OCR) ფუნქციით.
ასეთი გადაწყვეტილებები ძალზედ რთულია, რის შედეგადაც ბევრი ფული ღირს. თუ რეგულარულად გსურთ PDF- თან ტექსტის აღიარება, საჭიროა შესაბამისი პროგრამის შეძენა. იშვიათ შემთხვევებში უფრო ლოგიკური იქნებოდა, რომ მსგავსი ფუნქციების გამოყენება შესაძლებელი ყოფილიყო.
როგორ აღიარებს ტექსტი PDF- ის ონლაინ რეჟიმში
რა თქმა უნდა, OCR ონლაინ სერვისების ფუნქცია კომპლექტი უფრო შეზღუდულია შედარებით სრული დესკტოპის გადაწყვეტილებები. მაგრამ თქვენ შეგიძლიათ იმუშაოთ ასეთი რესურსებით ან უფასოდ, ან ნომინალური საფასური. მთავარი ისაა, რომ შესაბამისი ვებ-აპლიკაციები გაუმკლავდეს მათ ძირითად ამოცანას, კერძოდ ტექსტის აღიარებას.
მეთოდი 1: ABBYY FineReader ონლაინ
სერვისის განვითარების კომპანია ერთ-ერთი ლიდერია ოპტიკური დოკუმენტის აღიარების სფეროში. ABBYY FineReader for Windows და Mac არის ძლიერი გადაწყვეტა კონვერტაცია PDF ტექსტით და მუშაობს იგი.
პროგრამის ვებ-გვერდი, რა თქმა უნდა, უფრო ნაკლებია, ვიდრე ფუნქციურად. მიუხედავად ამისა, სერვისს შეუძლია აღიაროს ტექსტები სკანირებისა და ფოტოებისგან 190-ზე მეტ ენაზე. მხარს უჭერს PDF ფაილების კონვერტაცია Word, Excel და ა.შ.
ABBYY FineReader ონლაინ ონლაინ სერვისი
- სანამ დაიწყებთ მუშაობას ხელსაწყოსთან ერთად, შექმენით ანგარიში თქვენს ანგარიშზე ან შესვლას თქვენი Facebook, Google ან Microsoft ანგარიშის გამოყენებით.
შესვლის ფანჯარაში წასვლა ღილაკზე დაჭერით. "შესვლა" ზედა მენიუში. - ერთხელ შესული, შემოიტანოთ სასურველი PDF დოკუმენტი FineReader- ში ღილაკის გამოყენებით "ფაილების ატვირთვა".
შემდეგ დააჭირეთ "ნომრის არჩევა" და მიუთითეთ სასურველი span for ტექსტი აღიარება. - შემდეგ, აირჩიეთ დოკუმენტში წარმოდგენილი ენები, ფორმატირებული ფაილის ფორმატი და დააჭირეთ ღილაკს "აღიარება".
- დამუშავების შემდეგ, რომლის ხანგრძლივობა მთლიანად დამოკიდებულია დოკუმენტის ზომაზე, შეგიძლიათ ჩამოტვირთოთ მზა ფაილის ტექსტური მონაცემებით უბრალოდ დაწკაპვით მისი სახელით.
ან გადმოიტანეთ ის ერთ-ერთი ხელმისაწვდომი cloud მომსახურება.
სერვისი გამოირჩევა, ალბათ, სურათებისა და PDF ფაილების ყველაზე ზუსტი ტექსტური აღიარების ალგორითმებით. მაგრამ, სამწუხაროდ, მისი უფასო გამოყენება შემოიფარგლება თვეში 5 გვერდს. მეტი მოცულობითი დოკუმენტების გასაკეთებლად, თქვენ უნდა შეიძინოთ ერთწლიანი გამოწერა.
თუმცა, თუ OCR ფუნქცია საჭიროა ძალიან იშვიათად, ABBYY FineReader Online არის დიდი ვარიანტი მოპოვების ტექსტი მცირე PDF ფაილები.
მეთოდი 2: უფასო ონლაინ OCR
მარტივი და მოსახერხებელი მომსახურება ტექსტის ციფრებისთვის. სარეგისტრაციო საჭიროების გარეშე, რესურსი საშუალებას გაძლევთ აღიაროთ 15 სრული PDF- გვერდი საათში. უფასო ონლაინ OCR სრულად მუშაობს დოკუმენტებთან 46 ენაზე და ავტორიზაციის გარეშე მხარს უჭერს სამი საექსპორტო ფორმატის - DOCX, XLSX და TXT.
რეგისტრაციისას მომხმარებელი შეძლებს მრავალგვერდიანი დოკუმენტის დამუშავებას, მაგრამ ამ გვერდების უფასო რაოდენობა 50 ერთეულს შეადგენს.
უფასო ონლაინ OCR ონლაინ სერვისი
- PDF- ის "სტუმარს" ტექსტის აღიარება, რესურსის ნებართვის გარეშე, გამოიყენეთ შესაბამისი ფორმა საიტის ძირითადი გვერდი.
აირჩიეთ სასურველი დოკუმენტი ღილაკით "ფაილი", მიუთითეთ მთავარი ტექსტის ენა, გამოტანის ფორმატი, დაველოდოთ ფაილის ჩატვირთვას და დააჭირეთ "კონვერტაცია". - ციფრირების პროცესის დასასრულს დააწკაპუნეთ "Download Output File" დასრულდეს დოკუმენტი კომპიუტერში ტექსტით.
უფლებამოსილი წევრებისთვის, ქმედებების თანმიმდევრობა განსხვავებულია.
- გამოიყენეთ ღილაკი "რეგისტრაცია" ან "შესვლა" ზედა მენიუს ბარი, შესაბამისად, შექმენით ანგარიში უფასო ონლაინ OCR ან შევა მასში.
- აღიარების პანელში ავტორიზაციის შემდეგ, დააჭირეთ ღილაკს გასაღები "CTRL", აირჩიეთ წყაროს დოკუმენტის ორი ენა მდე.
- მიუთითეთ შემდეგი ვარიანტები PDF- დან ტექსტის მოპოვებისთვის და დააჭირეთ ღილაკს. "აირჩიეთ ფაილი" დატვირთვის დოკუმენტი სერვისში.
შემდეგ, დაიწყოს აღიარება, დააჭირეთ "კონვერტაცია". - დოკუმენტის დამუშავების შემდეგ დააჭირეთ ბმულს გამომავალი ფაილის სახელით შესაბამისი სვეტით.
აღიარების შედეგი დაუყოვნებლივ ინახება თქვენს კომპიუტერში.
თუ საჭიროა პატარა PDF დოკუმენტის ტექსტის ამონაწერი, შეგიძლიათ უსაფრთხოდ გამოიყენოთ ზემოთ აღწერილი ინსტრუმენტი. მსხვილ ფაილებთან მუშაობისთვის, თქვენ შეგიძლიათ შეიძინოთ დამატებითი სიმბოლოები უფასო ონლაინ OCR- ში ან სხვა გამოსავლის მიღებაზე.
მეთოდი 3: NewOCR
სრულიად უფასო OCR- სერვისი, რომელიც საშუალებას მოგცემთ ამოიღოთ ტექსტი პრაქტიკულად ნებისმიერი გრაფიკული და ელექტრონული დოკუმენტიდან, როგორიცაა DjVu და PDF. რესურსი არ აწესებს შეზღუდვებს ცნობადი ფაილების ზომასა და რაოდენობას, არ მოითხოვს რეგისტრაციას და სთავაზობს ფუნქციების ფართო სპექტრს.
NewOCR მხარს უჭერს 106 ენებზე და შეუძლია სწორად გაუმკლავდეს კი დაბალი ხარისხის დოკუმენტი Scans. შესაძლებელია ტექსტის ამოცნობისთვის ფართის შერჩევა ფაილის გვერდზე.
ონლაინ სერვისი NewOCR
- ასე რომ, თქვენ შეგიძლიათ დაიწყოთ მუშაობა დაუყოვნებლივ მუშაობის გარეშე, საჭიროების გარეშე.
პირდაპირ მთავარ გვერდზე არსებობს დოკუმენტი იმ დოკუმენტის იმპორტისთვის. NewOCR- ზე ფაილის ატვირთვისთვის გამოიყენეთ ღილაკი "აირჩიეთ ფაილი" განყოფილებაში "აირჩიეთ თქვენი ფაილი". შემდეგ სფეროში "აღიარების ენა (ენები)" აირჩიეთ წყაროს დოკუმენტის ერთი ან მეტი ენა, შემდეგ დააჭირეთ ღილაკს "ატვირთვა + OCR". - დააყენეთ სასურველი აღიარების პარამეტრები, აირჩიეთ სასურველი გვერდი ტექსტის ამონაწერი და დააჭირეთ ღილაკს. "OCR".
- გადაფურცლეთ ცოტა და იპოვეთ ღილაკი. ჩამოტვირთვა.
დააჭირეთ მასზე და ჩამოსაშლელ სიაში შეარჩიეთ საჭირო დოკუმენტის ფორმატის ჩამოტვირთვა. ამის შემდეგ, მოპოვებული ტექსტის დასრულებული ფაილი თქვენს კომპიუტერში გადმოწერილი იქნება.
ინსტრუმენტი არის მოსახერხებელი და აღიარებს ყველა სიმბოლოს საკმარისად მაღალი ხარისხის. თუმცა, იმპორტირებული PDF დოკუმენტის თითოეული გვერდის დამუშავება დამოუკიდებლად უნდა დაიწყოს და ცალკე ფაილში გამოჩნდეს. თქვენ შეგიძლიათ, რა თქმა უნდა, დაუყოვნებლივ დააკოპირეთ აღიარების შედეგები ბუფერში და შეუერთდეთ მათ სხვებს.
მიუხედავად ამისა, ზემოთ მოცემული ნიუანსში, ახალი მელოდიის გამოყენებით ტექსტის დიდი რაოდენობა ძნელია ამონაწერი. ამავე პატარა ფაილების სერვისი ხელს უწყობს "აფეთქებით".
მეთოდი 4: OCR.Space
მარტივი და გასაგები რესურსი ტექსტის ციფრებისთვის საშუალებას გაძლევთ აღიაროთ PDF დოკუმენტები და წარმოადგინოთ შედეგი TXT ფაილში. გვერდებზე არ არსებობს შეზღუდვები. ერთადერთი შეზღუდვა ის არის, რომ შეყვანის დოკუმენტის ზომა არ უნდა აღემატებოდეს 5 მეგაბაიტს.
OCR.Space ონლაინ სერვისი
- არ არის საჭირო ინსტრუმენტთან მუშაობის რეგისტრაცია.
უბრალოდ დააჭირეთ ბმულს და ატვირთეთ PDF დოკუმენტი თქვენი კომპიუტერის ვებ-გვერდის გამოყენებით "აირჩიეთ ფაილი" ან ქსელში - მითითებით. - Dropdown სიაში "აირჩიეთ OCR ენა" აირჩიეთ იმპორტირებული დოკუმენტის ენა.
შემდეგ დაიწყეთ ტექსტის ამოცნობის პროცესი ღილაკზე დაჭერით. "დაწყება OCR!". - ფაილის დამუშავების დასასრულს, იხილა შედეგი "OCR" შედეგი და დააჭირეთ ჩამოტვირთვაჩამოტვირთეთ მზა TXT დოკუმენტი.
თუ თქვენ უბრალოდ PDF- ის ტექსტის ამონაწერი გჭირდებათ და საბოლოო ფორმატირება არ არის მნიშვნელოვანი, OCR.Space არის კარგი არჩევანი. ერთადერთი დოკუმენტი უნდა იყოს "მონოლინგირება", რადგან სამსახურში იმავე დროს ორი ან მეტი ენის აღიარება არ არის გათვალისწინებული.
აგრეთვე იხილე: უფასო ანალოგები FineReader
სტატიაში წარმოდგენილი ონლაინ ინსტრუმენტები შეფასებისას უნდა აღინიშნოს, რომ ABBYY- ის FineReader Online- ი უშუალოდ OCR- ის ფუნქციას ახორციელებს. თუ ტექსტის აღიარების მაქსიმალური სიზუსტე თქვენთვის მნიშვნელოვანია, ეს არის კონკრეტულად განვიხილოთ ეს ვარიანტი. მაგრამ გადაიხადოს ეს, სავარაუდოდ, ასევე უნდა.
თუ საჭიროა მცირე დოკუმენტების გაცნობა და მზად იყოთ შეცდომების შესწორება სამსახურში, მიზანშეწონილია, გამოიყენოთ NewOCR, OCR.Space ან უფასო ონლაინ OCR.