lunes, 23 de octubre de 2023

NYT- Cómo Siri, Alexa y el Asistente de Google perdieron la carrera de la IA

 Brian X. Chen , Nico Grant 15 de marzo de 2023

Brian X. Chen, redactor principal de tecnología de consumo del Times, y Nico Grant, que cubre Google, informaron desde San Francisco. Karen Weise, que escribe sobre Amazon, vive en Seattle.


Un martes lluvioso en San Francisco, los ejecutivos de Apple subieron al escenario en un auditorio lleno de gente para presentar el iPhone de quinta generación . El teléfono, que parecía idéntico a la versión anterior, tenía una nueva característica que pronto llamó la atención del público: Siri, un asistente virtual .

Scott Forstall, entonces jefe de software de Apple, presionó un botón del iPhone para convocar a Siri y le hizo preguntas. A petición suya, Siri comprobó la hora en París (“8:16 pm”, respondió Siri), definió la palabra “mitosis” (“División celular en la que el núcleo se divide en núcleos que contienen el mismo número de cromosomas”, decía) y obtuvo una lista de 14 restaurantes griegos altamente calificados, cinco de ellos en Palo Alto, California.

"He estado en el campo de la IA durante mucho tiempo y esto todavía me sorprende", dijo Forstall.

Eso fue hace 12 años. Desde entonces, la gente no ha quedado impresionada por Siri y los asistentes de la competencia que funcionan con inteligencia artificial, como Alexa de Amazon y el Asistente de Google. La tecnología se ha mantenido en gran medida estancada y los asistentes parlantes se han convertido en el blanco de bromas, incluso en un sketch de “Saturday Night Live” de 2018 que presenta un altavoz inteligente para personas mayores.

El mundo de la tecnología ahora está entusiasmado con un tipo diferente de asistente virtual: los chatbots. Estos bots impulsados ​​por IA, como ChatGPT y el nuevo ChatGPT Plus de la empresa OpenAI de San Francisco, pueden improvisar respuestas a preguntas escritas en un cuadro de chat con presteza. La gente ha utilizado ChatGPT para manejar tareas complejas como codificar software, redactar propuestas comerciales y escribir ficción.


Y ChatGPT, que utiliza inteligencia artificial para adivinar qué palabra viene a continuación, está mejorando rápidamente. Hace unos meses no podía escribir un haiku adecuado; ahora puede hacerlo con gusto. El martes, OpenAI presentó su motor de IA de próxima generación, GPT-4 , que impulsa ChatGPT.

El entusiasmo en torno a los chatbots ilustra cómo Siri, Alexa y otros asistentes de voz, que alguna vez provocaron un entusiasmo similar, han desperdiciado su liderazgo en la carrera de la IA.

Durante la última década, los productos se toparon con obstáculos. Siri se topó con obstáculos tecnológicos, incluido un código torpe que tardó semanas en actualizarse con funciones básicas, dijo John Burkey, un ex ingeniero de Apple que trabajó en el asistente. Amazon y Google calcularon mal cómo se utilizarían los asistentes de voz, lo que los llevó a invertir en áreas con tecnología que rara vez valía la pena, dijeron exempleados. Cuando esos experimentos fracasaron, el entusiasmo por la tecnología disminuyó en las empresas, dijeron.

Los asistentes de voz son “tontos como una piedra”, dijo Satya Nadella, director ejecutivo de Microsoft, en una entrevista este mes con The Financial Times, declarando que la nueva IA lideraría el camino. Microsoft ha trabajado estrechamente con OpenAI, invirtiendo 13 mil millones de dólares en la puesta en marcha e incorporando su tecnología al motor de búsqueda Bing, así como a otros productos.


Apple se negó a comentar sobre Siri. Google dijo que estaba comprometido a proporcionar un excelente asistente virtual para ayudar a las personas en sus teléfonos y dentro de sus hogares y automóviles; La empresa está probando por separado un chatbot llamado Bard . Amazon dijo que vio un aumento del 30 por ciento en la participación del cliente a nivel mundial con Alexa en el último año y que era optimista acerca de su misión de construir una IA de clase mundial.


Los asistentes y los chatbots se basan en diferentes tipos de IA. Los chatbots funcionan con lo que se conoce como grandes modelos de lenguaje, que son sistemas entrenados para reconocer y generar texto basado en enormes conjuntos de datos extraídos de la web. Luego pueden sugerir palabras para completar una oración.

Por el contrario, Siri, Alexa y Google Assistant son esencialmente lo que se conoce como sistemas de comando y control. Estos pueden comprender una lista finita de preguntas y solicitudes como "¿Cómo está el clima en la ciudad de Nueva York?" o “Enciende las luces del dormitorio”. Si un usuario le pide al asistente virtual que haga algo que no está en su código, el robot simplemente dice que no puede ayudar.

Siri también tenía un diseño engorroso que hacía que agregar nuevas funciones llevara mucho tiempo, dijo Burkey, a quien se le asignó la tarea de mejorar Siri en 2014. La base de datos de Siri contiene una lista gigantesca de palabras, incluidos los nombres de artistas musicales y ubicaciones. como restaurantes, en casi dos docenas de idiomas.

Eso lo convirtió en “una gran bola de nieve”, dijo. Si alguien quisiera agregar una palabra a la base de datos de Siri, agregó, "se va en una gran pila".


Por lo tanto, actualizaciones aparentemente simples, como agregar algunas frases nuevas al conjunto de datos, requerirían reconstruir toda la base de datos, lo que podría llevar hasta seis semanas, dijo Burkey. Agregar funciones más complejas, como nuevas herramientas de búsqueda, podría llevar casi un año. Eso significaba que no había camino para que Siri se convirtiera en un asistente creativo como ChatGPT, dijo.

Alexa y Google Assistant dependían de tecnología similar a la de Siri, pero las empresas tuvieron dificultades para generar ingresos significativos con los asistentes, dijeron ex gerentes de Amazon y Google. (Por el contrario, Apple utilizó con éxito Siri para atraer compradores a sus iPhone).

Después de que Amazon lanzó Echo, un altavoz inteligente impulsado por Alexa, en 2014, la compañía esperaba que el producto le ayudara a aumentar las ventas en su tienda en línea al permitir a los consumidores hablar con Alexa para realizar pedidos, dijo un exlíder de Amazon involucrado con Alexa. Pero si bien la gente se divirtió jugando con la capacidad de Alexa para responder indicaciones meteorológicas y configurar alarmas, pocos le pidieron a Alexa que ordenara artículos , agregó.

Es posible que Amazon haya invertido demasiado en la fabricación de nuevos tipos de hardware, como despertadores y microondas ahora descontinuados que funcionaban con Alexa, que se vendían al costo o por debajo del mismo, dijo el ex ejecutivo.

La compañía también invirtió poco en la creación de un ecosistema para que las personas expandieran fácilmente las capacidades de Alexa, como lo hizo Apple con su App Store, lo que ayudó a avivar el interés en el iPhone, dijo la persona. Si bien Amazon ofrecía una tienda de “habilidades” para que Alexa controlara accesorios de terceros, como interruptores de luz, era difícil para las personas encontrar y configurar habilidades para los parlantes, a diferencia de la experiencia sin fricciones de descargar aplicaciones móviles desde las tiendas de aplicaciones.


“Nunca tuvimos ese momento en la App Store para los asistentes”, dijo Carolina Milanesi, analista de tecnología de consumo de la firma de investigación Creative Strategies que fue consultora de Amazon.

A finales del año pasado, la división de Amazon que trabajaba en Alexa fue uno de los principales objetivos de los 18.000 despidos de la empresa, y varios altos ejecutivos de Alexa abandonaron la empresa.

Kinley Pearsall, portavoz de Amazon, dijo que Alexa era mucho más que un asistente de voz y "somos tan optimistas sobre esa misión como siempre".



Los fallos de Amazon con Alexa pueden haber llevado a Google por mal camino, dijo un exgerente que trabajó en el Asistente de Google. Los ingenieros de Google pasaron años experimentando con su asistente para imitar lo que Alexa podía hacer, incluido el diseño de parlantes inteligentes y pantallas de tabletas controladas por voz para controlar accesorios del hogar como termostatos e interruptores de luz. Posteriormente, la empresa integró anuncios en esos productos para el hogar, que no se convirtieron en una fuente importante de ingresos.

Con el tiempo, Google se dio cuenta de que la mayoría de la gente usaba el asistente de voz sólo para un número limitado de tareas simples, como iniciar temporizadores y reproducir música, dijo el exgerente. En 2020, cuando Prabhakar Raghavan, un ejecutivo de Google, se hizo cargo del Asistente de Google, su grupo reenfocó al compañero virtual como una característica destacada para los teléfonos inteligentes Android.


En enero, cuando la empresa matriz de Google despidió a 12.000 empleados , el equipo que trabajaba en sistemas operativos para dispositivos domésticos perdió el 16 por ciento de sus ingenieros.


Muchas de las grandes empresas de tecnología ahora están compitiendo para encontrar respuestas a ChatGPT. El mes pasado, en la sede de Apple, la compañía celebró su cumbre anual de IA, un evento interno para que los empleados aprendan sobre su modelo de lenguaje grande y otras herramientas de IA, dijeron dos personas que conocieron el programa. Muchos ingenieros, incluidos miembros del equipo de Siri, han estado probando conceptos generadores de lenguaje cada semana, dijeron las personas.


El martes, Google también dijo que pronto lanzaría herramientas de inteligencia artificial generativa para ayudar a empresas, gobiernos y desarrolladores de software a crear aplicaciones con chatbots integrados e incorporar la tecnología subyacente en sus sistemas.


En el futuro, las tecnologías de chatbots y asistentes de voz convergerán, afirman los expertos en inteligencia artificial. Eso significa que las personas podrán controlar los chatbots con la voz, y quienes utilicen productos de Apple, Amazon y Google podrán pedirles a los asistentes virtuales que los ayuden con sus trabajos, no solo con tareas como consultar el clima.


"Estos productos nunca funcionaron en el pasado porque nunca tuvimos capacidades de diálogo a nivel humano", dijo Aravind Srinivas, fundador de Perplexity, una nueva empresa de inteligencia artificial que ofrece un motor de búsqueda impulsado por chatbot. "Ahora lo hacemos".



REF: https://www.nytimes.com/2023/03/15/technology/siri-alexa-google-assistant-artificial-intelligence.html