Gonsin Conference Equipment Co., LTD.
Gonsin Conference Equipment Co., LTD.

Продукция

Система автоматического распознавания речи ASR

Система автоматического распознавания речи GONSIN подходит для различных сценариев применения, включая протоколы заседаний, записи тренировок, речевые субтитры в реальном времени, транскрипцию записей интервью, записи судебных заседаний в реальном времени и т. Д. Она может объединять текст и запись голоса каждой роли, объединять и генерировать протоколы заседаний и поддерживать экспорт текста. Китайская конференц-системаПоддержка аренды облачных серверов и развертывания локальной сети сервера, обучения искусственному интеллекту и непрерывной оптимизации системы.

Speech To Text Software
Asr Automatic Speech Recognition
Speech To Text Software
Asr Automatic Speech Recognition

Как новая разработка современных решений для конференций, система автоматического распознавания речи (ASR) приносит более интеллектуальный опыт взаимодействия человека с компьютером. Для традиционных конференций общение звуком и видео больше не может удовлетворить современные потребности в конференциях. Кроме того, после совещания обработка документов, протоколы заседаний и юридические процедуры конкретных пользователей также должны быть представлены в формате слов. Система автоматического распознавания речи Gonsin может обеспечить полную и упорядоченную транскрипцию текста из звука в режиме реального времени и гарантирует, что текст соответствует речи каждого делегата. Расшифрованный текст может отображаться на большом экране, а также в безбумажной конференц-системе Gonsin в режиме реального времени.


Система ASR подходит для различных сценариев применения, включая протоколы встреч, записи тренировок, речевые субтитры в реальном времени, транскрипцию записей интервью, протоколы судебных заседаний в реальном времени и т. Д.


image.png


Решения системы автоматического распознавания голоса Gonsin

Система GONSIN ASR предлагает три решения: онлайн-решение для распознавания и перевода речи, легкое решение для частного развертывания и решение для частного развертывания в конференц-залах.


  • Решение распознавания и перевода речи онлайн

  • Легкое решение частного развертывания

  • Решение частного развертывания кластера конференц-зала


Преимущества системы автоматического распознавания речи

Программная система автоматического распознавания речи GONSIN разработана на платформе полностью цифровой технологии автоматического распознавания речи GONSIN. Подключая сетевые аудиоданные и фон ASR, а также поддерживая прикладное программное обеспечение ASR и GONSIN, он реализует транскрибирование голоса в реальном времени в текст.

Automatic Speech Recognition System

Программное обеспечение автоматического распознавания речи Gonsin V7.1.0

Основные функции

  • Поддержка общедоступного облака и проприетарной стыковки выбора облачного голосового сервера, которая может соответствовать различным методам развертывания серверов. Поддержка установки на ПК или сервер распознавания речи, который можно гибко применять в различных сценариях применения.

  • Поддержка функции управления выключением сервера ASR, сервера ASR, подключения системы обсуждения, поиска и функции настройки роли микрофона, а также поддержка публичного письма каждой серии бесшовной стыковки системы обсуждения, конференц-управления, разделения ролей и автоматического идентификации.

  • Поддержка управления персоналом и оборудованием, включая поиск оборудования, отображение информации о номере устройства, информации об IP-адресе и настройках имен персонала; поддержка редактирования информации о собраниях, включая новое название собрания, определение времени, местоположения и редактирование содержимого собрания.

  • Поддержка одновременного распознавания нескольких ролей микрофона и функции защиты от перекрестных помех, что может эффективно избежать взаимных перекрестных помех при одновременном распознавании нескольких микрофонов; поддержка подсказок состояния микрофона, которые могут отображать состояние включения и выключения микрофона в режиме реального времени.

  • Поддержка функции обучения языковой модели. Он поддерживает импорт общих слов, таких как имена людей и мест, для изучения языковой модели.

  • Поддержка автоматической идентификации ролей участников, автоматической идентификации голоса участников и транскрипции в текст. Программное обеспечение поддерживает перевод в другую требуемую речь (функции программного обеспечения варьируются в зависимости от возможностей движка)

  • Поддержка интеллектуального семантического понимания, которое может автоматически понимать семантику участников и автоматически разбивать предложения и сегменты в соответствии с семантикой. Поддержка автоматического преобразования последовательных номеров в арабский формат и поддержка автоматической идентификации номеров сотовых телефонов, удостоверений личности и других последовательных номеров, преобразованных в арабский формат.

  • Поддержка функций редактирования и исправления текста встречи. Создание отдельных файлов записи для разных ролей или объединение текстовых записей и записей каждой роли. Голосовые и текстовые записи могут быть синхронизированы с воспроизведением и отображением исправления документа.

  • Поддержка функции вывода записи встреч. Поддержка слияния текста, создания протоколов совещаний и экспорта текста.

  • Поддержка функции поиска контента, поддержка поиска текстового контента. Ключевые слова можно искать, быстро находить положение соответствующего контента, значительно повышая эффективность поиска контента.

  • Поддержка функции разделения экрана на текст. При установке на компьютер ПК вы можете реализовать отображение текста транскрипции в реальном времени на главном экране операционного компьютера, поддерживать расширение вывода с разделенным экраном, отображение текстового содержимого распознавания голоса в реальном времени. Поддержка функции настройки экрана, адаптивного разрешения экрана, поддержки шрифта текста, настроек размера, чтобы обеспечить высококачественную услугу отображения текста с разделенным экраном.

  • Поддержка распознавания файлов записи через импорт файлов записи автоматически преобразует содержимое файла записи в текстовое содержимое; поддержка mp3, wav и других форматов файлов.

  • Поддержка выбора устройств аудиовхода, вы можете подключить устройства аудиовхода компьютера, текст транскрипции аудиовхода в реальном времени

  • Поддержка компьютера для распознавания текущего воспроизведения звукового контента и автоматического преобразования его в текст.

  • Поддержка более настраиваемых функций: программное обеспечение поддерживает переключение на китайский и английский языки, а также другие пользовательские языки; поддержка вторичной разработки в соответствии с требованиями проекта протокола открытого интерфейса или индивидуальной разработки.


Технические параметры

СистемаОперационная система Win7 / win8 / win10 32 / 64 бит
ЦПУI7 или выше
Емкость жесткого диска500 ГБ или выше
Объем памяти16 ГБ или выше
ВидеокартаНезависимая видеокарта поддерживает интерфейс VGA / HDMI / DVI и поддерживает разделенный экран.
Интерфейс ПК1 * RS-232 интерфейс и 2 * интерфейса RJ45
РезолюцияСамо-адаптивный
Связь с ПКEthernet/RS-232


Основные функции

  • Хорошая совместимость системы, поддержка отображения субтитров для устройств Windows и Android.

  • Поддержка нескольких настроек режима отображения субтитров. Поддержка полноэкранного режима и всплывающего режима

  • Полноэкранный режим: отображение содержимого транскрипции в полноэкранном режиме в виде диалогового окна. Поддержка настройки фона и настройки шрифта.

  • Режим заграждения: отображение содержимого транскрипции в стиле плавающего заграждения. Поддержка настройки линии и настройки шрифта

  • Функция субтитра оверлея поддержки видео-: функция субтитра в реальном времени поддержки покрывая на видео-экране, интегрированная с видео-конференцинг и камерой отслеживая применения.

  • Поддержка функции безбумажного наложения субтитров: позволяет наложение субтитров в реальном времени на безбумажные экраны, интеграцию с безбумажными системами и отображение транскрибированного текста в режиме реального времени на безбумажных терминалах.

Легкий интеллектуальный сервер автоматического распознавания речи

Основные функции

  • Благодаря интеллектуальному программному обеспечению для распознавания голоса он может реализовать управление веб-доступом.

  • Поддержка автоматического распознавания ролей участников, автоматического распознавания голоса участника и транскрипции в текст

  • Благодаря встроенному движку ASR Engine внедрите ведущую в отрасли технологию онлайн-распознавания речи, развернутую через облако для предоставления услуг распознавания речи для локальной речи. Низкая задержка, высокая точность распознавания, точность может достигать более 99%

  • Сервер распознавания речи может осуществлять транскрипцию речи разных каналов:

  • GX-AS201: поддерживает одностороннее распознавание речи

  • GX-AS202: поддерживает двустороннее распознавание речи

  • GX-AS205: поддерживает 5-полосное распознавание речи

  • GX-AS208: поддерживает 8-полосное распознавание речи

  • Поддержка индивидуального распознавания языков, таких как китайский, английский, испанский, арабский, русский и французский.

  • Поддержка распознавания в нескольких сценариях применения: образовательный, судебный, медицинский, выступление на конференциях, средства массовой информации, развлекательное видео, умный дом, социальный, автомобильный и т. Д.

  • Поддержка нескольких конференц-залов для совместного использования сервера. Поддержка нескольких конференц-залов в конференц-центре для формирования локальной сети и централизованное развертывание сервера для параллельного распознавания речи и транскрипции в нескольких конференц-залах.

  • Благодаря интеллектуальному программному обеспечению для отображения субтитров с распознаванием речи обеспечьте услугу отображения субтитров для конференций.

Технические параметры

МодельGX-AS201GX-AS202GX-AS205GX-AS208
Версия системыЦентос 7,4 +
ЦПУI3I7
Объем памяти16G32G
Жесткий дискТвердотельный накопитель 256 ГБТвердотельный накопитель 500 Гб
Интерфейс передней панели4 × USB2.0 Тип-A, 1 × 3,5 мм линия вне, 1 × 3,5 мм Micin, 1 × Кнопка питания, 1 × Power LED
Интерфейс задней панели4 × USB3.0 Type-A, 1 × RJ4510/100/1000M, 1 × HDMI 1,4 выход, 1 × COM-выход, 1 × 3,5 мм линейный выход, 1 × 3,5 мм микрофон, 1 × WIFI/BT ANT
Потребляемая мощность19 В постоянного тока
Рабочая температура-5 ° C ~ 45 ° C
Температура хранения-20 ° C ~ 60 ° C
Объем210 (Д) × 210 (Ш) × 56 (В) мм


Сервер автоматического распознавания речи ASR GX-AS301

Основные функции

  • Стандартный сервер 2U, монтируемый в стойку, со стабильной и надежной производительностью, с использованием оцинкованной стальной пластины SGCC, экологически чистой наружной краски, устойчивостью к отпечаткам пальцев и устойчивостью к сильным магнитным помехам 4 кВ

  • Принять высокопроизводительный конфигурационный сервер LINNUX, установить программное обеспечение ASR Engine V3.0 для автоматической идентификации ролей участников, автоматического распознавания голосов участников и транскрипции в текст.

  • Поддержка нескольких конференц-залов для совместного использования сервера. Поддержка нескольких конференц-залов в конференц-центре для создания локальной сети и централизованное развертывание сервера для удовлетворения потребностей нескольких конференц-залов в параллельном распознавании речи и транскрипции.

  • Совместная работа с интеллектуальным программным обеспечением для отображения субтитров с распознаванием речи для предоставления услуг отображения субтитров на совещаниях

  • Высокоэффективная модель CTC, благодаря дополнительной авторизации, один сервер поддерживает максимум 50 одновременных распознавания.

  • Сервер использует механизм шифрования SSL для эффективного обеспечения безопасности хранения и передачи конфиденциальной информации. Алгоритмы шифрования RC4, MD5 и RSA используются для обеспечения безопасности данных платформы и предотвращения утечки важной информации.

  • Встроенное встроенное программное обеспечение для управления питанием. Он может контролировать состояние напряжения, чтобы избежать отказа оборудования, вызванного колебаниями напряжения, и реализовать всепогодную защиту.


Двигатель автоматического распознавания речи GONSIN V3.1/V3.2

  • Благодаря ведущей в отрасли технологии онлайн-распознавания речи, развернутой через облако для предоставления услуг распознавания речи для локальной речи. Низкая задержка, высокая точность распознавания, точность может достигать более 99%

  • Движок использует модель пакетной оплаты, эффективно снижая входную стоимость и порог построения распознавания речи. Пользователи могут приобрести пакетную программу соответствующей длины в соответствии с фактическими потребностями в длине распознавания речи (пожалуйста, приобретите пакетное обслуживание вовремя, чтобы обеспечить нормальное использование движка)

  • Опознавание поддержки разделенное роли: различные языки оригинала и языки перевода можно выбрать согласно различным ролям, для того чтобы осуществить одновременное опознавание множественных языков, транскрипцию в соответствуя текст, и перевод.

  • Поддержка нескольких основных языков, таких как китайский, английский, французский, русский, арабский и испанский.

  • Благодаря интеллектуальному программному обеспечению для отображения субтитров с распознаванием речи он может отображать исходный текст и переведенный текст одновременно или настраиваться на отдельное отображение исходного/переведенного текста, предоставляя услугу субтитров для деловых переговоров и видеоконференций на разных языках.


GONSIN Автоматическое распознавание речи Engine V3.0

  • Принять интеллектуальную технологию модели распознавания языка, основанную на технологии AI, для достижения распознавания речи

  • Поддержка индивидуального распознавания языков, таких как китайский, английский, испанский, арабский, русский и французский

  • Поддержка распознавания в нескольких сценариях применения: образовательный, судебный, медицинский, выступление на конференциях, средства массовой информации, развлекательное видео, умный дом, социальный, автомобильный и т. Д.

Любое программное обеспечение для автоматического распознавания речи, независимо от его сложности, может извлекать и декомпозировать ваши слова для анализа и ответа, а его базовая последовательность событий указана следующим образом:

1. Поговорите с программным обеспечением через аудиовход.

2. Автоматическое распознавание голоса, с которым вы говорите, создаст волновой файл ваших слов.

3. Файлы сигналов были очищены путем удаления фонового шума и нормализации громкости.

4. Отфильтрованные формы сигналов разлагаются на так называемые фонемы. (Фонемы являются основными компонентами языка и произношения слов. В английском языке 44 таких слова, состоящих из вокальных блоков, таких как «wh», «th», «ka» и «t»).

5. Каждая фонема действует как цепочка, начиная с первой фонемы и анализируя их последовательно, а распознаватель речи ASR использует статистический вероятностный анализ, чтобы вывести целое слово, а затем вывести полные предложения оттуда.

6. Ваша программа автоматического распознавания речи ASR, которая теперь «понимает» ваши слова, может ответить вам осмысленным образом.



Как работает программное обеспечение для автоматического распознавания речи?

Любое программное обеспечение для автоматического распознавания речи, независимо от его сложности, может извлекать и декомпозировать ваши слова для анализа и ответа, а его базовая последовательность событий указана следующим образом:

1. Поговорите с программным обеспечением через аудиовход.

2. Автоматическое распознавание голоса, с которым вы говорите, создаст волновой файл ваших слов.

3. Файлы сигналов были очищены путем удаления фонового шума и нормализации громкости.

4. Отфильтрованные формы сигналов разлагаются на так называемые фонемы. (Фонемы являются основными компонентами языка и произношения слов. В английском языке 44 таких слова, состоящих из вокальных блоков, таких как «wh», «th», «ka» и «t»).

5. Каждая фонема действует как цепочка, начиная с первой фонемы и анализируя их последовательно, а распознаватель речи ASR использует статистический вероятностный анализ, чтобы вывести целое слово, а затем вывести полные предложения оттуда.

6. Ваша программа автоматического распознавания речи ASR, которая теперь «понимает» ваши слова, может ответить вам осмысленным образом.


Автоматическое распознавание речи Учебник


Продукты конфигурации системы Система автоматического распознавания речи ASR




Контакты Нас

Gonsin здесь, чтобы предложить вам индивидуальные решения для конференц-аудио и видео системы.

Пожалуйста, заполните информацию правдиво, чтобы мы могли связаться с вами и предоставить услуги как можно скорее.



Сопутствующие товары Система автоматического распознавания речи ASR
Обеспечение доверия & значение
Вы можете
Доверие.
Авторские права© Gonsin Conference Equipment Co., LTD. Все права защищены.
Включенная информация и спецификации могут быть изменены без предварительного уведомления.