Google con Gemini ha subido la apuesta del desarrollo de la IA generativa

Google está decidido a conducir hacia algo más significativo que los chatbots actuales

Ciencia y Tecnología

Dic-09-2023

194
Google con Gemini ha subido la apuesta del desarrollo de la IA generativa

 

RFInforma / Google/ sábado 9 de diciembre del 2023

Redacción.-

La historia de la inteligencia artificial se ha visto salpicada por períodos que se conocen como «inviernos de la IA», en los que la tecnología parecía encontrarse en un callejón sin salida y el financiamiento se agotaba. Todos ellos han ido acompañados de proclamas de que hacer máquinas realmente inteligentes es demasiado difícil para los humanos.

El lanzamiento de Gemini por parte de Google, que se presenta como un modelo de IA fundamentalmente nuevo y el más potente de la empresa hasta la fecha, sugiere que el nuevo invierno de la IA no llegará pronto. De hecho, aunque los 12 meses transcurridos desde el lanzamiento de ChatGPT han sido un año excepcional para la IA, hay buenas razones para pensar que el auge actual de la IA no ha hecho más que empezar.

Apenas es el comienzo
OpenAI no tenía grandes expectativas cuando lanzó el «avance de investigación de bajo perfil» llamado ChatGPT en noviembre de 2022. Se trataba simplemente de una prueba de una nueva interfaz para sus modelos de lenguaje de gran tamaño (LLM) generadores de texto. Pero la capacidad del chatbot para hacer cosas tan diversas, desde sintetizar ensayos y poesía hasta responder a problemas de codificación, impresionó y desconcertó a mucha gente e incendió la industria tecnológica. Cuando OpenAI añadió su nuevo GPT-4 LLM a ChatGPT, algunos expertos se asustaron tanto que rogaron a la empresa que fuera más despacio.

Ya eran escasas las pruebas de que alguien hubiera hecho caso a esa voz de alarma. Ahora resulta inconcebible que Google haya subido la apuesta, y quizá también haya cambiado las reglas del juego, al anunciar Gemini.

Google ya se había apresurado a dar una respuesta directa a ChatGPT en forma de Bard a principios de este año, lanzando finalmente la tecnología de chatbot LLM, que había desarrollado antes que OpenAI, pero que decidió mantener en privado. Con Gemini, declara haber abierto una nueva era que va más allá de los LLM anclados principalmente en el texto, sentando potencialmente las bases para una nueva ronda de productos de IA significativamente diferentes de los habilitados por ChatGPT.

Gemini es un modelo multimodal nativo
Google denomina a Gemini un modelo «multimodal nativo», lo que significa que puede aprender de datos que van más allá del texto, absorbiendo también información de audio, vídeo e imágenes. ChatGPT demuestra que los modelos de IA pueden aprender mucho sobre el mundo si se les proporciona suficiente texto. Algunos investigadores de IA han afirmado que el simple hecho de hacer más grandes los modelos de lenguaje aumentaría sus capacidades hasta el punto de rivalizar con las de los humanos.

Pero no se puede aprender tanto sobre la realidad física a través del filtro del texto que los humanos han escrito sobre ella, y las limitaciones difíciles de erradicar de los LLM, como la alucinación de información, el razonamiento deficiente y sus extraños fallos de seguridad- parecen sugerir que la ampliación de la tecnología existente tiene sus límites.

Antes del anuncio de Gemini de ayer, WIRED habló con Demis Hassabis, el ejecutivo que dirigió el desarrollo de Gemini y cuyos logros anteriores incluyen la dirección del equipo que desarrolló el robot superhumano AlphaGo. Hassabis se mostró previsiblemente efusivo con Gemini, afirmando que introduce nuevas capacidades que harán que los productos de Google destaquen. Pero Hassabis también dijo que para ofrecer sistemas de IA capaces de entender el mundo de un modo que los chatbots actuales no pueden, los LLM tendrán que combinarse con otras técnicas de IA.

Nuevas formas de ver
Hassabis mantiene una agresiva competencia con OpenAI, pero los rivales parecen estar de acuerdo en que se necesitan nuevos enfoques radicales. Un misterioso proyecto en curso en OpenAI, denominado Q*, sugiere que la empresa también está explorando ideas que implican hacer algo más que ampliar sistemas como GPT-4.

Esto encaja con las declaraciones realizadas en abril por el director ejecutivo de OpenAI, Sam Altman, en el MIT, cuando dejó claro que, a pesar del éxito de ChatGPT, el campo de la IA necesita una gran idea nueva para seguir avanzando de forma significativa. «Creo que estamos al final de la era en la que van a ser estos modelos gigantescos», opinó Altman. «Los mejoraremos de otras formas».

Es posible que Google acabe de demostrar un enfoque que puede ir más allá de ChatGPT. Pero quizás el mensaje más notable del lanzamiento de Gemini es que Google está decidido a conducir hacia algo más significativo que los chatbots actuales, al igual que OpenAI parece estarlo también.

» Fuente «