Search
Close this search box.

ChatGPT se humaniza: te podrá ver, oír y hablar

ChatGPT se humaniza
  • Según los últimos datos disponibles, ChatGPT cuenta actualmente con más de 100 millones de usuarios.
  • Según Similarweb, chat.openai.com ha sido visitado aproximadamente 1.600 millones de veces en los últimos 30 días.
  • Según YouGov, el 17 por ciento de las personas entre 30 y 44 años han utilizado ChatGPT desde enero de 2023. De manera similar, el 15 por ciento de las personas entre 18 y 29 años han utilizado ChatGPT para generar texto.
  • OpenAI ahora lo hace más atractivo: ChatGPT se humaniza.

OpenAI se está embarcando en una expansión significativa de las capacidades de ChatGPT, y es que el chatbot cada vez se humaniza más, ahora te podrá ver, oír y hablar. Este desarrollo representa un gran salto para hacer que las interacciones con ChatGPT sean más intuitivas y versátiles. Permite entablar conversaciones de voz con la IA o compartir imágenes para mejorar la comunicación.

La integración de funciones de voz e imagen abre una infinidad de posibilidades para los usuarios de ChatGPT. Por ejemplo, mientras viajan, podrán capturar una foto de un punto de referencia y participar en una conversación en vivo con ChatGPT para descubrir datos interesantes sobre la imagen. Cuando regrese a casa, podrá hacer click en las imágenes de su refrigerador y despensa para ayudar a planificar el menú de la cena e incluso hacer preguntas de seguimiento para obtener recetas paso a paso.

Estas mejoras se implementarán para los usuarios Plus y Enterprise durante las próximas dos semanas. La función de voz estará disponible tanto en iOS como en Android, y los usuarios pueden optar por ella a través de su configuración. Las imágenes serán accesibles en todas las plataformas.

La voz de ChatGPT

Los usuarios pueden participar en conversaciones de voz fluidas con ChatGPT. Ya sea que estén en movimiento o buscando un cuento antes de dormir, ChatGPT puede entablar una conversación de ida y vuelta. Para comenzar con la voz, será necesario navegar hasta Configuración en la aplicación móvil, elegir Nuevas funciones y optar por las conversaciones de voz. Luego, habrá que tocar el ícono de auriculares en la esquina superior derecha de la pantalla de inicio y seleccionar la voz preferida entre cinco opciones.

Para las funciones de voz, OpenAI colaboró ​​con actores de doblaje profesionales para crear cada una de estas voces y utilizar su sistema de reconocimiento de voz de código abierto, Whisper, para transcribir palabras habladas en texto.

 

La mirada del chatbot

Los usuarios pueden presentar ChatGPT con una o más imágenes, abriendo infinitas posibilidades. Solución de problemas como por qué la parrilla no arranca o una análisis de gráficos complejos en busca de datos relacionados con el trabajo. Para iniciar interacciones basadas en imágenes, los usuarios pueden tocar el botón de foto para capturar o seleccionar una imagen. Para usuarios de iOS y Android, deberán comenzar tocando el botón más. También se pueden discutir varias imágenes o utilizar la herramienta de dibujo para guiar al asistente.

La comprensión de imágenes de ChatGPT es posible gracias a la combinación de los modelos multimodales GPT-3.5 y GPT-4. Estos modelos aplican sus habilidades de razonamiento lingüístico a una amplia gama de imágenes, incluidas fotografías, capturas de pantalla y documentos que contienen texto e imágenes.

 

Nuevos riesgos de que ChatGPT se humanice

Si bien la nueva tecnología de voz puede crear voces sintéticas realistas, también plantea nuevos desafíos y riesgos, como la posibilidad de que actores malintencionados se hagan pasar por figuras públicas o cometan fraude. Para abordar esto, OpenAI está implementando inicialmente esta tecnología para un caso de uso específico: el chat de voz. Las voces utilizadas han sido cuidadosamente elaboradas con actores de voz contratados directamente por OpenAI. Las colaboraciones con otras entidades, como Spotify para la traducción de voz, ejemplifican cómo esta tecnología puede mejorar la accesibilidad y la creatividad.

Los modelos basados ​​en la visión, por otro lado, plantean desafíos únicos, incluidas alucinaciones e interpretaciones en dominios de alto riesgo. Antes de un despliegue más amplio, OpenAI llevó a cabo pruebas rigurosas, involucrando a miembros del equipo rojo para evaluar riesgos en dominios como el extremismo y la competencia científica, así como a diversos evaluadores alfa. Esta investigación permitió a la empresa establecer directrices clave para un uso responsable.

OpenAI está comprometido con la transparencia con respecto a las limitaciones de ChatGPT. Si bien el modelo destaca en la transcripción de textos en inglés, su rendimiento puede ser subóptimo con otros idiomas, en particular aquellos que utilizan escrituras no romanas. Por lo tanto, se desaconseja a los usuarios que no hablan inglés confiar en ChatGPT para fines especializados en estos idiomas.

 

Otras notas que también te pueden interesar:

ERNIE Bot está listo para rivalizar con ChatGPT

ChatGPT Enterprise, lo nuevo de OpenAI para las empresas

Análisis pronostica quiebra de OpenAI por ChatGPT en 2024

Sé parte de InformaBTL

Únete a más de 25 mil lectores

Regístrate a nuestro newsletter en la siguiente forma y recibe a primera hora las noticias más importantes de marketing de consumo, BTL y retail tu correo.

Populares

Contenido Premium

Más sobre Below The Line

Artículos relacionados

You don't have credit card details available. You will be redirected to update payment method page. Click OK to continue.