Categories: Ai

Создание искусственного датасета для обучения модели с использованием Paddle OCR

Привет, коллеги! Продолжаем тему разработки плагина для распознавания иврита с использованием Paddle OCR. В прошлый раз я забыла представиться, сделаю это в этом посте)
Меня зовут Алексей, я руковожу компанией, которая занимается разработкой с применением ИИ-технологий. Сам я тоже погружен в разработку, но больше доверяю это своей команде – нам удалось собрать команду классных профи. Истории из нашей совместной работы я и планирую рассказывать в своем блоге.

Вернемся к теме статьи. Сегодня остановимся подробнее на создании искусственного датасета для обучения модели с использованием Paddle OCR. Этим занимался мой коллега Александр – экспертв компьютерном зрении.

Когда перед нами встала задача распознавания текста на иврите, стало ясно, что найти готовый датасет с нужными характеристиками практически невозможно. Это подтолкнуло нас к созданию собственного датасета, который оказался не только полезным, но и дал возможность потренироваться в генерации синтетических данных. В этом посте мы подробно расскажем, как именно подошли к этому процессу.

Next Описание комбинационных схем без таблиц истинности »

Previous « Что такое TDD. Создаем валидатор паролей на регулярках

Published by

4 месяца ago

В Telegram запущен новый дейтинг-сервис Swipy

Создание искусственного датасета для обучения модели с использованием Paddle OCR

Recent Posts

Магия CSS на практике: советы по вёрстке от гика. Часть 4

JavaScript: структуры данных и алгоритмы. Часть 5

Реализация событий через HTTP

Каннибализм трафика. Нужно ли вести контекст по брендовым запросам?

Презентация Apple 2024: новая кнопка на iPhone 16, функция слухового аппарата у AirPods, кинокамера в iPhone Pro

Сразу два аналога Notion, бесплатный сервис аналитики для продавцов на WB – эти и другие российские стартапы

Создание искусственного датасета для обучения модели с использованием Paddle OCR

Related Post

Recent Posts

Магия CSS на практике: советы по вёрстке от гика. Часть 4

JavaScript: структуры данных и алгоритмы. Часть 5

Реализация событий через HTTP

Каннибализм трафика. Нужно ли вести контекст по брендовым запросам?

Презентация Apple 2024: новая кнопка на iPhone 16, функция слухового аппарата у AirPods, кинокамера в iPhone Pro

Сразу два аналога Notion, бесплатный сервис аналитики для продавцов на WB – эти и другие российские стартапы