Оптик тэмдэгтийн хүлээн зөвшөөрөлт гэж юу вэ (OCR)?

Оприк Тэмдэг таних тэмдэг (OCR) гэдэг нь гар бичмэл эсвэл бичвэр оруулах шаардлагагүйгээр компьютер уншиж чаддаг хэвлэсэн, бичсэн, эсвэл гар бичмэлийн документ тоон хувилбарыг бий болгох програм хангамжийг хэлнэ. OCR нь ерөнхийдөө сканнердсан документ дээр PDF форматаар ашиглагддаг боловч дүрс файл дотор уншигдахуйц компьютерийн текст үүсгэх боломжтой.

OCR гэж юу вэ?

OCR, мөн текстийг таних гэж нэрлэдэг програм хангамж нь тоо, үсэг, цэг таслал гэх мэт тэмдэгтүүд, үсгүүд, цэг таслал (глафс гэж нэрлэдэг) хэвлэмэл болон бичмэл баримт бичгүүдээс компьютер, програм хангамжаар илүү амархан танигдаж, унших боломжтой цахим хэлбэрт хувиргадаг программ хангамжийн технологи юм. Зарим OCR програмууд нь баримтжуулалтыг дижитал камераар сканнердсан, эсвэл бусад зургуудаар хийдэг бөгөөд бусад нь OCR-ыг ашиглаагүй, урьд нь сканердсан, баримтжуулсан баримт бичигт энэ процессыг ашиглаж болно. OCR нь хэрэглэгчид PDF баримт дотор хайх, текст засварлах, баримт бичгүүдийг дахин хэлбэржүүлэх боломжийг олгодог.

Ашиглах OCR гэж юу вэ?

Хурдан, өдөр бүр скайнердах хэрэгцээ, OCR нь ихээхэн хэмжээний асуудал биш юм. Хэрэв та их хэмжээний хайлт хийж байгаа бол PDF дотор хайж олохын тулд яг хэрэгтэй байгаа зүйлийг олохын тулд маш бага хугацаа хэмнэж, OCR ажиллагаа таны сканнерын програмд ​​илүү чухал байдаг. OCR нь дараах зүйлсийг тусалдаг өөр бусад зүйлсийг үзүүлэв:

Яагаад OCR ашиглах вэ?

Яагаад зураг авч болохгүй гэж? Яагаад гэвэл та ямар нэгэн юм засах эсвэл текстийг хайж олох боломжгүй байсан учраас энэ нь зөвхөн зураг байх болно. Баримтыг хайж, OCR програм хангамжийг ажиллуулах нь уг файлыг засварлах боломжтой, хайлт хийх боломжтой болно.

OCR-ийн түүх

1914 онд текстийг таних хамгийн эртний хэлбэр нь OCR-тэй холбоотой технологийг 1950-аад онд эхэлсэн бөгөөд ялангуяа дижитал хэлбэрт уншигдахуйц текст рүү хөрвүүлэхэд хялбар болгосон хялбар фонтуудыг бий болгосон. Эдгээр хялбаршуулсан фонтуудын эхнийх нь David Shepard-ээр бүтээгдсэн бөгөөд OCR-7B гэж нэрлэгддэг. OCR-7B нь өнөө үед зээлийн карт, дебит карт дээр ашиглагддаг стандарт фонтыг ашиглан санхүүгийн салбарт ашиглагдаж байна. 1960-аад онд хэд хэдэн оронд шуудангийн үйлчилгээ OCR технологийг OCR, Америкийн Нэгдсэн Улс, Их Британи, Канад, Герман зэрэг шуудангаар ангилах боломжийг хурдасгах болсон. OCR нь дэлхий даяар шуудангийн үйлчилгээнүүдийг шуудангаар ангилах үндсэн технологи хэвээр байна. 2000 онд OCR технологийн хязгаар, чадварын талаарх үндсэн мэдлэг нь вакцин, софамеруудыг зогсооход ашиглагддаг CAPTCHA програмуудыг хөгжүүлэхэд ашиглагддаг.

Хэдэн арван жилийн хугацаанд OCR нь хиймэл оюун ухаан , машин суралцах , компьютерийн алсын хараа гэх мэт холбогдох технологийн салбарт дэвшил гарсантай холбоотойгоор илүү нарийн, илүү боловсронгуй болсон. Өнөөдөр OCR програм нь баримтыг хүлээн зөвшөөрөх, шинж чанарыг илрүүлэх, текст олборлох үйл явцыг урьд өмнө хэзээ ч байгаагүйгээр илүү хурдан, илүү нарийвчлалтайгаар хувиргахад ашигладаг.