модели · речь

Whisper: речь в текст

Whisper - открытая модель распознавания речи от OpenAI. Она превращает аудио и видео в текст на многих языках, включая русский. Запускают её по-разному: локально, через OpenAI API или через Groq - быстро и дёшево. Этот гайд объясняет простыми словами, какой способ выбрать, как готовить звук и от чего зависит точность.

Whisper: распознавание речи в текст

для кого этот курс

Расшифровать встречу
Есть запись звонка или интервью - хочу получить текст, чтобы не слушать заново.
Сделать субтитры
Нужно вытащить из видео реплики и собрать заметки или субтитры.
Не знаю, что выбрать
Слышал про Whisper, локально, Groq, API - но не понимаю, чем они отличаются.

программа курса