Мәтінді сәйкестендіріп тану
Атырау қаласы, Атырау облысы
№9 мектеп, информатика пәні мұғалімі — Оразғалиева Айман Тыныштыққызы
Сабақтың тақырыбы
Мәтіндерді танып алу программасы (OCR). Сканерленген мәтіндерді редакциялау. Құжаттарды мәтіндік процессорға экспорттау.
Сабақтың типі
Тәжірибелік элементі бар жаңа тақырыпты түсіндіру сабағы.
Көрнекілігі
- Компьютер
- Мәтіналғы (сканер)
- Принтер
- ABBYY FineReader
- Флипчарт
- Тапсырма карточкалары
Нәтиже күтілімі
- Білуі тиіс: FineReader, сканер және принтермен жұмыс.
- Меңгеруі тиіс: OCR жүйесімен жұмыс, мәтінді суреттен бөліп алу.
Білімділік
Мәтінді тану ұғымдарын қалыптастыру, логикалық ойлауды дамыту, іскерлік дағдыларды жетілдіру және пәнге қызығушылықты арттыру.
Дамытушылық
Техникалық ойлау қабілетін дамыту.
Тәрбиелік
Әсемдікке, ұқыптылыққа баулу.
Сабақтың барысы
I. Ұйымдастыру кезеңі
Оқушыларды ұйымдастыру, түгендеу және сабаққа дайындықты тексеру.
II. Үй тапсырмасын тексеру
Үй тапсырмасының орындалуын тексеру және негізгі қателерді қысқаша талдау.
III. Жаңа сабақ: OCR және FineReader
Қазіргі таңда нарықта мәтінді сәйкестендіру (тану) жүйелерінің бірнеше түрі бар. Олар әртүрлі іскерлік ортаға және әртүрлі платформаларға бейімделген. Мысалдар: FineReaderOnline.ru, ABBYY FineReader, Readiris, Persian Reader, Kirtas Technologies Arabic OCR, CuneiForm және т.б.
Кең қолданылатындары: ABBYY FineReader және CuneiForm.
FineReader — мәтіналғы (сканер) арқылы алынған кескіндегі мәтінді оптикалық сәйкестендіру технологиясы арқылы (OCR — Optical Character Recognition) мәтінге түрлендіретін жүйе. Оны ABBYY Software компаниясы әзірлеген.
Бағдарлама 186 тілді қолдайды, соның ішінде 38 тілде орфографиялық тексеру бар. Қолжазба мәтінін тануға да мүмкіндік береді, бірақ жазу стилі әр адамда әртүрлі болғандықтан дәлдігі төмендеуі мүмкін.
OCR бағдарламалары: қысқаша шолу
| Атауы | Лицензия | ОЖ | Ескерту |
|---|---|---|---|
| FineReaderOnline.ru | Коммерциялық | Online | Сканерленген көптілді құжаттар мен фотосуреттерді танитын Online OCR. Нәтижені PDF, PDF/A, DOC, RTF, XLS, TXT форматтарына конверттейді. |
| ABBYY FineReader | Коммерциялық және жекеменшік | Windows; Linux; macOS | Белгілі бір тілді тану үшін сол тілдің қолдауы (тілдік пакет) қажет. |
| Readiris | Коммерциялық және жекеменшік | Windows; macOS | I.R.I.S. Group (Бельгия) өнімі. Аймақтық пакеттерді, сондай-ақ Азия және Таяу Шығыс тілдерін қолдайды. |
| Persian Reader | Коммерциялық және жекеменшік | Windows | Парсы тіліне арналған OCR шешімі. |
| Kirtas Technologies Arabic OCR | Коммерциялық | Windows | Ағылшын және араб тілдерін оқи алады. |
| CuneiForm | BSD | Windows (GUI), Linux, macOS, FreeBSD (CLI) | Мәтінді сақтайды, кестелерді тани алады. Өнеркәсіптік деңгейдегі көптілді жүйе. |
FineReader-дің негізгі мүмкіндіктері
- Сканерленген кескінді тануда жоғары дәлдік және жұмыс жылдамдығы.
- Қарапайым әрі түсінікті интерфейс.
- Әрекеттердің логикалық тізбегі: сканерлеу → тану → конверттеу.
- Microsoft Office құжаттарымен жұмыс істеу кезінде мәтінді тану және өңдеу мүмкіндігі.
- Гиперсілтемелерді және электрондық пошта мекенжайларын автоматты түрде тану.
- Кіріктірілген анықтамалық (Help) жүйесі.
Бағдарлама терезесінің құрылымы
- Бет терезесі
- Сурет терезесі
- Мәтін терезесі
- Жылдам қол жеткізу панелі
- Басты құралдар панелі
- Бет/сурет/мәтін құралдары панелі
- Мәтін қасиеттері панелі
- Үлкейтіп көрсету (Zoom)
Басты құралдар панелінде негізгі әрекеттерді орындауға арналған батырмалар орналасады.
ABBYY FineReader-де құжат енгізудің 4 кезеңі
- 1 Кескінді алу (құжатты сканерге қою).
- 2 Тану (OCR іске қосу).
- 3 Тексеру (қателерді түзету).
- 4 Сақтау (қажетті форматқа экспорттау).
Практикалық орындалуы:
- Құжатты мәтіналғыға орналастыру.
- Құралдар тақтасынан Сканерлеу командасын таңдау.
- Кескіннің сурет терезесіне түсуін бақылау.
- Танып алу командасын іске қосу.
- Нәтижені тексеру және түзету.
- Құжатты Microsoft Word-қа экспорттау.
Қазақша мәтінді тану
FineReader бағдарламасында қазақша мәтінді де сканерлеуге, тануға және экспорттауға болады. Ол үшін компьютерге KazKey v8.1 (New) қазақ тілі драйверін орнату жеткілікті.
IV. Бекіту кезеңі (практикалық тапсырмалар)
№1 тапсырма: Мәтінді сәйкестендіріп тану
- 1 Компьютерге сканерленген құжатты (Fine_upr1) сақтаңдар.
- 2 FineReader бағдарламасын іске қосыңдар.
- 3 FineReader арқылы сақталған (Fine_upr1) құжатын ашыңдар.
- 4 Мәтінді танып алыңдар (OCR).
- 5 Нәтижені Word форматында сақтаңдар.
- 6 Word құжатында қажетті түзетулер енгізіңдер.
№2 тапсырма: Кестені тану және Excel-ге экспорттау
- 1 Компьютерге сканерленген құжатты (Fine_upr2) сақтаңдар.
- 2 FineReader бағдарламасын іске қосыңдар.
- 3 FineReader арқылы сақталған (Fine_upr2) құжатын ашыңдар.
- 4 Мәтіндегі кестені белгілеп, сәйкестендіріп таныңдар.
- 5 Танылған кестені Excel-ге экспорттап, түрлендіріңдер.
V. Қорытынды кезең
Тақырып бойынша бақылау сұрақтары:
- ABBYY FineReader бағдарламасының қызметі қандай?
- ABBYY FineReader терезесінің құрылымын атаңдар.
- ABBYY FineReader-де құжат енгізу неше кезеңнен тұрады? Мысал келтіріңдер.
- FineReader-де қазақша мәтінді қалай тануға және экспорттауға болады?
- Сәйкестендіріп тану үшін қандай бағдарламалар қолданылады?
VI. Бағалау
Оқушылардың бағасы сабақтағы тапсырмаларды орындауына және меңгеру деңгейіне қарай қойылады.
VII. Үй тапсырмасы
Тақырыпты оқу және негізгі ұғымдарды қайталау.