Nuestro sitio web utiliza cookies para mejorar y personalizar su experiencia y para mostrar anuncios (si los hay). Nuestro sitio web también puede incluir cookies de terceros como Google Adsense, Google Analytics, Youtube. Al usar el sitio web, usted consiente el uso de cookies. Hemos actualizado nuestra Política de Privacidad. Por favor, haga clic en el botón para consultar nuestra Política de Privacidad.

Cómo los nuevos algoritmos de IA mejoran la colaboración entre modelos de inteligencia artificial

https://www.bbva.com/wp-content/uploads/2017/10/numeros-binario-codigo-algoritmo-recurso-bbva.jpg

Los avances recientes en la inteligencia artificial (IA) podrían marcar un antes y un después en el uso de modelos de lenguaje de gran escala (LLM), como ChatGPT y Gemini, al permitir la colaboración entre modelos de diferentes empresas. Un equipo de investigadores del Instituto Weizmann de Ciencias de Israel, en colaboración con Intel Labs, ha presentado una serie de algoritmos innovadores que resuelven una de las principales limitaciones actuales de la IA: la barrera de comunicación entre modelos de diferentes orígenes.

Durante la Conferencia Internacional sobre Aprendizaje Automático (ICML), que tuvo lugar en Vancouver, Canadá, los investigadores presentaron un avance importante que podría transformar el rendimiento y la accesibilidad de los grandes modelos de inteligencia artificial. Con esta nueva estrategia, los modelos más pequeños y rápidos interactúan con modelos más grandes y poderosos, optimizando no solo la eficiencia, sino también disminuyendo significativamente los costos computacionales.

Superando los obstáculos comunicativos en la IA

Hasta el momento, uno de los mayores retos para una cooperación eficiente entre modelos de IA ha sido la incapacidad de estos para «comunicarse» en el mismo idioma digital. Cada modelo de IA emplea su propio conjunto único de tokens o «lenguajes» internos, lo que implica que los modelos creados por diversas compañías no pueden compartir información ni colaborar de forma efectiva.

El problema de esta incompatibilidad de «idiomas» ha sido resuelto por los investigadores del Instituto Weizmann y de Intel Labs. A través de sus nuevos algoritmos, han logrado que los modelos puedan trabajar en conjunto sin necesidad de que todos los modelos hablen el mismo «idioma». Los investigadores diseñaron un algoritmo que permite a un modelo de gran escala (LLM) traducir su salida desde su propio lenguaje de tokens a un formato común que todos los modelos puedan entender. Además, desarrollaron un segundo algoritmo que asegura que los modelos se basen principalmente en tokens que tengan el mismo significado entre los diferentes sistemas, facilitando la colaboración y mejorando la precisión de las respuestas.

Consecuencias de los recientes algoritmos

La implementación de estos novedosos algoritmos promete aumentar la eficiencia de los LLM aproximadamente en 1,5 veces, llegando en ciertas situaciones hasta 2,8 veces más veloz. Este progreso no solo incrementa la rapidez de los modelos de IA, sino que también permite a las compañías y a los desarrolladores utilizar la inteligencia artificial de una manera más efectiva, economizando una gran cantidad de recursos de cálculo y disminuyendo los gastos operativos.

Los nuevos algoritmos ya están disponibles de forma gratuita para los desarrolladores de todo el mundo en la plataforma de código abierto Hugging Face Transformers. Esta disponibilidad ha permitido que los desarrolladores integren estas herramientas en sus aplicaciones, mejorando la eficiencia y el rendimiento de sus procesos de IA.

Efecto sobre dispositivos externos y usos prácticos

Una de las grandes ventajas de este desarrollo es su aplicabilidad en aparatos con capacidad de cómputo limitada. Dispositivos como teléfonos móviles, drones y automóviles autónomos, que a menudo operan sin conexión a internet, obtendrán grandes beneficios de los algoritmos, ya que podrán realizar procesos de IA más ágiles y precisos sin necesidad de depender de una conexión constante a la nube. En el caso de un automóvil autónomo, por ejemplo, la habilidad de tomar decisiones rápidas y acertadas es fundamental para asegurar la seguridad vial, y la utilización de estos modelos veloces podría marcar la diferencia entre una elección correcta y un posible accidente.

El porvenir de la IA generativa y sus usos

Los desarrollos de estos algoritmos representan un progreso significativo en el ámbito de la inteligencia artificial generativa, dado que facilitan la cooperación entre distintos modelos, optimizando no solo su desempeño, sino también la accesibilidad y la eficiencia de la tecnología. Los progresos en la IA generativa no solo están destinados a aplicaciones en el entorno digital, sino que también tienen una repercusión importante en sectores como la automatización, la robótica y la industria del transporte.

Los estudiosos han destacado la significancia de esta innovación para impulsar el progreso en el desarrollo de sistemas autónomos y aplicaciones con IA, particularmente en escenarios donde los recursos computacionales son escasos. El estudio sobre este asunto ha tenido tanta relevancia que fue elegido para una exposición pública en la ICML, un honor concedido solo a aproximadamente el 1 por ciento de las propuestas recibidas, lo cual subraya la trascendencia de este avance en la comunidad de inteligencia artificial.

Un paso adelante para la colaboración en IA

El desarrollo de estos algoritmos marca un hito significativo en el campo de la inteligencia artificial, abriendo la puerta a una colaboración más efectiva y eficiente entre diferentes modelos de IA. Con la capacidad de superar la barrera de los «idiomas» internos de los modelos, esta innovación promete mejorar el rendimiento de la IA en diversas aplicaciones, desde el desarrollo de software hasta la creación de dispositivos autónomos y aplicaciones móviles.

Mientras la inteligencia artificial sigue progresando, es probable que estas tecnologías jueguen un rol esencial en el porvenir de la IA, permitiendo a compañías y desarrolladores construir soluciones más rápidas, accesibles y poderosas. El efecto de esta investigación será crucial para crear nuevas aplicaciones que optimicen la eficiencia y la seguridad en un mundo cada vez más dominado por la inteligencia artificial.

Por Otilia Adame Luevano

También te puede gustar