Waa maxay Aqoonsiga Astaamaha (Optical Character Recognition) (OCR)?

Aqoonsiga Habdhaqanka Farsamada (OCR) wuxuu loola jeedaa software kaas oo abuuraya nuqul dijitaal ah oo ah dukumenti daabacan, daabacan, ama gacanta ah oo kombuyutariyadu akhriyi karaan iyada oo aan loo baahnayn in lagu qoro ama qoro qoraalka. OCR waxaa guud ahaan loo isticmaalaa dukumintiyada la tarjumay ee qaabka PDF , laakiin sidoo kale waxay abuuri kartaa qoraal computer oo la akhrin karo oo ah faylka muuqaalka.

Waa maxay OCR?

OCR, oo sidoo kale loo yaqaan aqoonsiga qoraalka, waa tignoolajiyada software taas oo bedesho jilayaasha sida xarumaha, xarfaha, iyo xarakeynta (oo sidoo kale lagu magacaabo glyphs) ka soo daabacan dukumintiyada daabacan ama qoraaga ee qaab elektaroonig ah oo si fudud loo aqoonsado oo loo akhriyo kombiyuutarada iyo barnaamijyada kale ee software. Qaar ka mid ah barnaamijyada OCR waxay u sameeyaan sida dukumeentiga lagu sawiray ama lagu sawiray kamarad dijital ah iyo kuwo kaleba waxay codsan karaan dukumiinti hore loogu sawiray ama sawir leh iyada oon lahayn OCR. OCR wuxuu u ogolaanayaa dadka isticmaala inay dukumiintiyada PDF-ga ka raadiyaan, qoraalka qoraalka, iyo dib-u-qaabeynta dukumentiyada

Maxay OCR u Isticmaaltay?

Si dhakhso ah, maalin walba baahida baaritaanka, OCR ayaa laga yaabaa inaysan noqonin heshiis weyn. Haddii aad sameyso xawaalad badan oo sawir ah, awood u leh in aad ka raadiso PDF-yada si aad u ogaato midka aad u baahan tahay inaad ku badbaadin karto wakhti yar oo aad ka dhigto hawlaha OCR ee barnaamijkaaga scanner ka muhiimsan. Halkan waxaa ku qoran waxyaabo kale oo OCR ka caawinaya:

Maxaad u isticmaashaa OCR?

Waa maxay sababta aan sawir qaadin kaliya, sax? Maadaama aadan awoodin inaad wax ka beddesho ama aad raadiso qoraalka maxaa yeelay waxay noqoneysaa sawir. Diiwaangelinta dukumeentiga iyo isticmaalka software-ka OCR waxay u rogi kartaa feylka wax aad ku dari karto oo aad awoodi karto inaad raadiso.

Taariikhda OCR

Inkastoo isticmaalka ugu muhiimsan ee aqoonsiga qoraalka ah ee 1914, horumarinta ballaarinta iyo isticmaalka tiknoolojiyada la xidhiidha OCR ayaa bilaabay si taxadar leh 1950-yada, gaar ahaan samaynta qoraalo aad u fudud oo si sahlan loogu beddelayo qoraalka digitally-readable text. Midda koowaad ee qaababka fudud ee la fududeeyay waxaa abuuray David Shepard oo inta badan loo yaqaan OCR-7B. OCR-7B ayaa wali isticmaalaya warshadaha maaliyadeed ee qoraalka caadiga ah ee loo isticmaalo kaararka deynta iyo kaararka deynta. 1960kii, adeegyadii boostada ee dalal badan ayaa bilaabay isticmaalka tiknoolajiyadda OCR si ay si aad ah ugu dedejiyaan kala-soocidda waraaqaha, oo ay ka mid yihiin Mareykanka, Ingiriiska, Kanada, iyo Jarmalka. OCR waa wali tiknoolajiyada muhiimka ah ee loo isticmaalo in lagu xakameeyo adeega boostada adduunka. Sannadkii 2000, aqoonta muhiimka ah ee xuduudaha iyo awoodaha tiknoolojiga OCR ayaa loo adeegsaday horumarinta barnaamijyada CAPTCHA ee loo isticmaalo joojinta bots iyo spamers.

Tobaneeyo sano, OCR waxay kobcisay si sax ah oo aad u sareeya sababtoo ah horumarka ka jira meelaha farsamada la xidhiidha sida sirta farsamada , barashada mashiinka , iyo aragtida kombiyuutarka. Maanta, software-ka OCR wuxuu adeegsanayaa aqoonsiga qaabka, helitaanka muuqaalka, iyo macdanta qoraalka si loo beddelo dukumintiyada si deg deg ah iyo si sax ahba ka badan sidii hore.