Pernahkah kamu untuk menggunakan teknologi yang mendorong orang dapat membaca koran atau majalah fisik dengan menggunakan scanner ocr.
Ocr ( Optical Character Recognition ) merupakan teknologi scanning yang mampu mengalihkan file gambar ke dalam aplikasi program pengelolahan kata, seperti ms word, excel, acrobat reader, dbase, dan program lainnya yang anda gunakan sehingga tidak perlu melakukan pengetikkan ulang dari sumber dokumen tersebut.
Hal ini sangat membantu anda mempercepat pekerjaan mengetik dan mengalihkan dokumen cetak menjadi file digital.
Ocr bisa dibilang teknologi yang sudah lama, namun karena teknologi PC-nya semakin berkembang maka teknologi ini juga turut berkembang pula. cukup dengan memindai/scanning dokumen, maka OCR akan mendeteksi setiap karakter didalam gambar pindai lalu mengubahnya menjadi karakter-karakter teks.
OCR yaitu, alat mekanis atau elektronika yang digunakan untuk menerjemahkan tulisan tangan ataupun naskah ketikan, biasanya dipindai menggunakan pemindai menjadi teks yang dapat diedit dengan suatu aplikasi komputer.
Ocr adalah sebuah sistem komputer yang dapat membaca huruf, baik yang berhasal dari sebuah pencetakan ( printer atau mesin ketik ) maupun yang berhasal dari tulisan tangan. adanya sistem pengenalan huruf ini akan meningkatkan fleksibilitas ataupun kemampuan dan kecerdasan sistem komputer. dengan adanya sistem ocr maka user akan lebih leluasa memasukan data karena user tidak harus memakai papan ketik, tetapi bisa menggunakan pena elektronik untuk menulis sebagaimana user menulis dikertas.
adanya ocr juga akan memudahkan penanganan pekerjaan yang memakai input tulisan, seperti penyortiran surat dikantor pos dan pemasukan data buku diperpustakaan. adanya sistem pengenal huruf yang cerdas akan sangat membantu usaha besar-besaran yang saat ini dilakukan banyak pihak, yakni usaha digitalisasi informasi dan pengetahuan, misalnya dalam pembuatan koleksi pustaka digital dan koleksi sastra kuno digital.
Ocr dapat dipandang sebagai bagian dari pengenal pola otomatis ( Automatic Pattem Recognition ).
dalam pengenalan pola otomatis, sistem pengenalan pola mencoba mengenali apakah citra masukan yang diterima cocok dengan salah satu citra yang telah ditentukan. sistem ini misalkan dipakai untuk mengembangkan pembuatan pengenal pola otomatis, antara lain memakai pendekatan numerik, statistik, sintaktik, neural, dan aturan produksi.
Cara kerjanya Ocr sendiri yaitu, mengubah gambar yang berisi teks, baik itu dari mesin ketik, cetakan komputer, ataupun tulisan tangan diubah menjadi teks yang dapat diolah kembali dikomputer.
dengan kata lain Ocr adalah mengubah hardcopy menjadi softcopy.
Prosedur kerja Ocr meliputi File input(bmp) > Preprocessing > Segmentasi > Normalisasi > Ekstraksi ciri > Recognition > ASCI text.
1. Data Capture
Merupakan proses konversi suatu dokumen ( Hardcopy ) menjadi suatu file gambar (bmp ).
2. Preprocessing
merupakan suatu proses untuk menghilangkan bagian-bagian yang tidak diperlukan pada gambar input untuk proses selanjutnya.
3. Segmentasi
proses memisahkan area pengamatan pada setiap karakter yang akan dideteksi.
4. Normalization
proses mengubah dimensi tiap karakter dan ketebalan karakter. dalam ocr algoritma yang digunakan pada proses ini yaitu, algoritma scanling dan thinning.
5. Feature extraction
proses untuk mengambil ciri-ciri tertentu dari karakter yang diamati.
6. Recognition
proses untuk mengenali karakter yang diamati dengan cara membandingkan ciri-ciri karakter yang ada pada database.
7. Postprocessing
pada umumnya, proses yang dilakukan pada tahap ini adalah proses koreksi ejaan sesuai dengan bahasa yang digunakan.
itulah beberapa tentang ocr.