Технологии

Truecaller и Microsoft внедряют возможность ответа на звонки с помощью «ИИ-двойника»

Выдать за другого человека себя нельзя.

Truecaller представил новую функцию, позволяющую пользователям отвечать на звонки с помощью персонализированного ИИ-двойника их голоса. Это стало возможным благодаря сотрудничеству с Azure AI Speech от Microsoft, которая предоставляет технологию для создания голосового клона. Пользователи записывают короткий голосовой клип, который затем используется для создания искусственного голоса.

Ранее Truecaller Assistant мог фильтровать звонки и сообщать о цели звонка, предлагая три варианта: ответить самому, попросить помощника ответить или полностью заблокировать звонок. Теперь же помощник может не только отвечать, но и делать это с помощью синтезированного голоса пользователя, пишет The Verde.

Microsoft обеспечивает ограниченное использование этой функции, например, для ИИ-ассистентов, и добавляет «водяные знаки» ко всем сгенерированным голосам. «Кодекс поведения» компании требует от пользователей получать согласие на запись голоса и запрещает выдавать себя за другого человека.

Похожие разработки активно ведутся и другими компаниями. Например, Google разрабатывает свою технологию синтеза речи под названием WaveNet, созданную подразделением DeepMind. Эта технология использует глубокое обучение для генерации высококачественного синтетического голоса, который практически неотличим от реального человеческого. WaveNet находит применение в продуктах Google Assistant, обеспечивая более естественное и точное звучание голосовых команд и ответов.

Кроме того, компания Amazon активно работает над совершенствованием своего голосового помощника Alexa. В 2020 году Amazon представила функцию, позволяющую пользователям создавать персонализированные голосовые команды и ответы, основанные на синтезе их собственного голоса. Это также включает в себя возможность настройки интонации и стиля речи, что позволяет сделать общение с устройствами более естественным и персонализированным.

Другие компании, такие как Apple и Baidu, также развивают свои технологии синтеза речи. Apple использует нейронные сети для улучшения голосов в Siri, а Baidu разрабатывает свою платформу синтеза речи, которая уже используется в различных продуктах и сервисах компании.

Технология синтеза речи имеет широкий спектр применения, начиная от виртуальных помощников и заканчивая системами автоматического ответа в call-центрах. Она позволяет улучшить пользовательский опыт, делая взаимодействие с технологиями более естественным и удобным.

Однако использование синтезированных голосов вызывает и определенные опасения. Важно учитывать вопросы безопасности и этики, связанные с возможностью подделки голосов. Для предотвращения злоупотреблений компании внедряют меры предосторожности, такие как «водяные знаки» и обязательное получение согласия на использование голоса.

Truecaller и другие компании продолжают развивать свои технологии, стремясь сделать взаимодействие с пользователями максимально удобным и безопасным. Синтезированные голоса становятся неотъемлемой частью современных технологий, предлагая новые возможности и улучшения в области коммуникации и взаимодействия.

🔥
😁
👏
🤔
💩