viernes, 14 de febrero de 2025

Por Qué el Software Se Está Comiendo el Mundo


Marc Andreessen, Publicado agosto 20, 2011

https://a16z.com/es/por-que-el-software-se-esta-comiendo-el-mundo/

El software se está comiendo el mundo.

Más de 10 años después del pico de la burbuja de puntocom de la década de 1990, aproximadamente una docena de nuevas empresas de Internet como Facebook y Twitter están generando controversia en Silicon Valley, debido a sus valuaciones de mercado privado de rápido crecimiento, e incluso a la exitosa oferta pública inicial ocasional. Con las cicatrices del apogeo de Webvan y Pets.com aún frescas en la psique de los inversores, la gente pregunta: “¿No es esto solo una nueva burbuja peligrosa?”

Yo, junto con otros, he estado discutiendo el otro lado del caso. (Soy cofundador y socio general de la empresa de capital de riesgo Andreessen-Horowitz, que ha invertido en Facebook, Groupon, Skype, Twitter, Zynga y Foursquare, entre otros. También soy un inversionista personal en LinkedIn). Creemos que muchas de las nuevas y prominentes empresas de Internet están construyendo negocios reales, de alto crecimiento, de alto margen y altamente defendibles.

En realidad, el mercado bursátil actual odia la tecnología, como lo demuestran los bajos índices de precios/ganancias de todos los tiempos para las principales empresas de tecnología pública. Apple, por ejemplo, tiene una relación de precio-beneficio de alrededor de 15,2, casi la misma que el mercado de valores en general, a pesar de la inmensa rentabilidad y la posición dominante en el mercado de Apple (esta se convirtió en las últimas dos semanas en la compañía más grande de Estados Unidos, a juzgar por la capitalización de mercado, superando a Exxon Mobil). Y, tal vez la mayoría de las veces, no se puede tener una burbuja cuando la gente grita constantemente “¡Burbuja!”

Pero gran parte del debate sigue girando en torno a la valoración financiera, a diferencia del valor intrínseco subyacente de las mejores empresas nuevas de Silicon Valley. Mi propia teoría es que estamos en medio de un cambio tecnológico y económico dramático y amplio en el que las empresas de software están preparadas para apoderarse de grandes sectores de la economía.

Cada vez más empresas e industrias importantes funcionan con software y se ofrecen como servicios en línea, desde películas hasta agricultura y defensa nacional. Muchos de los ganadores son empresas de tecnología empresarial al estilo de Silicon Valley que están invadiendo y revocando estructuras industriales establecidas. Durante los próximos 10 años, espero que muchas más industrias se vean afectadas por el software, con nuevas empresas de Silicon Valley líderes en el mundo haciendo la disrupción en la mayoría de los casos.


¿Por qué está sucediendo esto ahora?


Seis décadas después de la revolución informática, cuatro décadas desde la invención del microprocesador y dos décadas después del surgimiento de la Internet moderna, toda la tecnología necesaria para transformar las industrias a través del software finalmente funciona y puede distribuirse ampliamente a escala global.

Más de dos mil millones de personas ahora usan Internet de banda ancha, un aumento con respecto a los 50 millones de personas hace una década, cuando estaba en Netscape, la compañía que cofundé. En los próximos 10 años, espero que al menos cinco mil millones de personas en todo el mundo posean teléfonos inteligentes, lo que le dará a cada persona con un teléfono de este tipo acceso instantáneo a toda la potencia de Internet, en cada momento de cada día.

En el backend, las herramientas de programación de software y los servicios basados en Internet facilitan el lanzamiento de nuevas empresas globales impulsadas por software en muchas industrias, sin la necesidad de invertir en nueva infraestructura y capacitar a nuevos empleados. En el año 2000, cuando mi socio Ben Horowitz fue director ejecutivo de la primera empresa de computación en la nube, Loudcloud, el costo de que un cliente ejecutara una aplicación básica de Internet era de aproximadamente 150 000 USD al mes. Ejecutar esa misma aplicación hoy en la nube de Amazon cuesta alrededor de 1500 USD al mes.

Con costos iniciales más bajos y un mercado ampliamente expandido para los servicios en línea, el resultado es una economía global que, por primera vez, estará completamente conectada digitalmente: el sueño de todo cibervisionario de principios de la década de 1990, finalmente entregado, una generación completa más tarde.

Quizás el ejemplo más dramático de este fenómeno del software que se come un negocio tradicional es el suicidio de Borders y el correspondiente ascenso de Amazon. En 2001, Borders acordó entregar su negocio en línea a Amazon bajo la teoría de que las ventas de libros en línea no eran estratégicas ni importantes.

Hoy en día, el mayor vendedor de libros del mundo, Amazon, es una compañía de software, su capacidad principal es su increíble motor de software para vender prácticamente todo en línea, sin necesidad de tiendas minoristas. Además de eso, mientras Borders estaba en medio de una inminente bancarrota, Amazon reorganizó su sitio web para promocionar sus libros digitales Kindle sobre los libros físicos por primera vez. Ahora incluso los libros en sí son software.

El servicio de video más grande de la actualidad por cantidad de suscriptores es una compañía de software: Netflix. Cómo Netflix destripó a Blockbuster es una vieja historia, pero ahora otros proveedores de entretenimiento tradicionales enfrentan la misma amenaza. Comcast, Time Warner y otros responden transformándose en empresas de software con esfuerzos como TV Everywhere, que libera contenido del cable físico y lo conecta a teléfonos inteligentes y tabletas.

Las compañías de música dominantes de hoy en día también son compañías de software: iTunes, Spotify y Pandora de Apple. Los sellos discográficos tradicionales existen cada vez más solo para proporcionar contenido a esas compañías de software. Los ingresos de la industria provenientes de canales digitales alcanzaron un total de 4600 millones de dólares en 2010, aumentando del 2 % al 29 % de los ingresos totales en 2004.

Las empresas de entretenimiento de más rápido crecimiento en la actualidad son fabricantes de videojuegos (de nuevo, software) y la industria crece a 60 mil millones de dólares desde los 30 mil millones de dólares de hace cinco años. Y la principal empresa de videojuegos de más rápido crecimiento es Zynga (fabricante de juegos, incluida FarmVille), que ofrece sus juegos completamente en línea. Los ingresos de Zynga en el primer trimestre crecieron a 235 millones de USD este año, más del doble de ingresos que un año atrás. Se espera que Rovio, fabricante de Angry Birds, obtenga 100 millones de USD en ingresos este año (la compañía estaba casi en bancarrota cuando debutó el popular juego en el iPhone a fines de 2009). Mientras tanto, las potencias de videojuegos tradicionales como Electronic Arts y Nintendo han visto que los ingresos se estancan y caen.

Pixar, la mejor empresa nueva de producción de películas en muchas décadas, fue una empresa de software. Disney (¡Disney!) tuvo que comprar Pixar, una compañía de software, para seguir siendo relevante en las películas animadas.

La fotografía, por supuesto, fue consumida por el software hace mucho tiempo. Es prácticamente imposible comprar un teléfono móvil que no incluya una cámara impulsada por software, y las fotos se cargan automáticamente a Internet para su archivo permanente y uso compartido global. Empresas como Shutterfly, Snapfish y Flickr han entrado en el lugar de Kodak.

La plataforma de marketing directo más grande de la actualidad es una compañía de software: Google. Ahora se ha unido a Groupon, Living Social, Foursquare y otros, que utilizan software para comer a la industria de marketing minorista. Groupon generó más de 700 millones de USD en ingresos en 2010, después de haber estado en el negocio durante solo dos años.

La empresa de telecomunicaciones de más rápido crecimiento en la actualidad es Skype, una empresa de software que acaba de comprar Microsoft por 8500 millones de USD. CenturyLink, la tercera empresa de telecomunicaciones más grande de los EE. UU., con una capitalización de mercado de 20 000 millones de USD, tenía 15 millones de líneas de acceso a fines del 30 de junio, lo que disminuyó a una tasa anual de alrededor del 7 %. Sin incluir los ingresos de su adquisición en Qwest, los ingresos de CenturyLink de estos servicios heredados disminuyeron en más del 11 %. Mientras tanto, las dos empresas de telecomunicaciones más grandes, AT&T y Verizon, han sobrevivido al transformarse en empresas de software, al asociarse con Apple y otros fabricantes de teléfonos inteligentes.

LinkedIn es la empresa de reclutamiento de más rápido crecimiento en la actualidad. Por primera vez, en LinkedIn, los empleados pueden mantener sus propios currículums para que los reclutadores busquen en tiempo real, lo que les da a LinkedIn la oportunidad de comer la lucrativa industria de reclutamiento de 400 mil millones de USD.

El software también está comiendo gran parte de la cadena de valor de las industrias que se consideran ampliamente existentes principalmente en el mundo físico. En los automóviles actuales, el software ejecuta los motores, controla las características de seguridad, entretiene a los pasajeros, guía a los conductores hacia destinos y conecta cada automóvil a redes móviles, satelitales y GPS. Los días en que un aficionado a los automóviles podía reparar su propio automóvil quedaron atrás, debido principalmente al alto contenido de software. La tendencia hacia los vehículos híbridos y eléctricos solo acelerará el cambio de software: los automóviles eléctricos están completamente controlados por computadora. Y la creación de automóviles sin conductor impulsados por software ya está en marcha en Google y las principales compañías de automóviles.

El minorista líder en el mundo real de hoy, Wal-Mart, utiliza software para potenciar sus capacidades de logística y distribución, que ha utilizado para aplastar a su competencia. Igualmente para FedEx, que es considerada mejor como una red de software que tiene camiones, aviones y centros de distribución conectados. Y el éxito o fracaso de las aerolíneas hoy y en el futuro depende de su capacidad para cotizar boletos y optimizar rutas y rendimientos correctamente, con software.

Las empresas de petróleo y gas fueron los primeros innovadores en la supercomputación y visualización y análisis de datos, que son cruciales para los esfuerzos actuales de exploración de petróleo y gas. La agricultura también está cada vez más impulsada por el software, incluido el análisis satelital de suelos vinculados a algoritmos de software de selección de semillas por acre.

La industria de servicios financieros ha sido visiblemente transformada por el software durante los últimos 30 años. Prácticamente todas las transacciones financieras, desde alguien que compra una taza de café hasta alguien que comercializa un billón de dólares de derivados de incumplimiento de crédito, se realizan en software. Y muchos de los innovadores líderes en servicios financieros son empresas de software, como Square, que permite a cualquier persona aceptar pagos con tarjeta de crédito con un teléfono móvil y PayPal, que generó más de mil millones de USD en ingresos en el segundo trimestre de este año, un aumento del 31 % con respecto al año anterior.

En mi opinión, la atención médica y la educación están a la vanguardia para la transformación fundamental basada en software. Mi empresa de capital de riesgo está apoyando empresas emergentes agresivas en estas industrias gigantes y críticas. Creemos que estas dos industrias, que históricamente se han resistido mucho al cambio empresarial, están preparadas para recibir propinas de grandes nuevos empresarios centrados en el software.

Incluso la defensa nacional se basa cada vez más en software. El soldado de combate moderno está integrado en una red de software que proporciona inteligencia, comunicaciones, logística y orientación sobre armas. Los drones impulsados por software lanzan ataques aéreos sin poner en riesgo a los pilotos humanos. Las agencias de inteligencia realizan minería de datos a gran escala con software para descubrir y rastrear posibles conspiraciones terroristas.

Las empresas de todas las industrias deben asumir que se acerca una revolución de software. Esto incluye incluso industrias que actualmente se basan en software. Las grandes empresas de software establecidas como Oracle y Microsoft se ven cada vez más amenazadas por la irrelevancia de las nuevas ofertas de software como Salesforce.com y Android (especialmente en un mundo en el que Google posee un importante fabricante de teléfonos).

En algunas industrias, particularmente aquellas con un componente pesado del mundo real como el petróleo y el gas, la revolución del software es principalmente una oportunidad para los titulares. Pero en muchas industrias, las nuevas ideas de software darán como resultado el surgimiento de nuevas empresas emergentes al estilo de Silicon Valley que invaden las industrias existentes con impunidad. Durante los próximos 10 años, las batallas entre los titulares y los insurgentes impulsados por software serán épicas. Joseph Schumpeter, el economista que acuñó el término “destrucción creativa”, estaría orgulloso.

Y aunque las personas que observan los valores de sus 401(k) rebotar hacia arriba y hacia abajo en las últimas semanas pueden dudarlo, esta es una historia profundamente positiva para la economía estadounidense en particular. No es un accidente que muchas de las empresas de tecnología más grandes, incluidas Google, Amazon, eBay y más, sean empresas estadounidenses. Nuestra combinación de excelentes universidades de investigación, una cultura empresarial a favor del riesgo, fondos profundos de capital social en busca de innovación y leyes comerciales y contractuales confiables no tiene precedentes ni tiene paralelo en el mundo.

Aun así, enfrentamos varios desafíos. En primer lugar, cada empresa nueva actual se está construyendo frente a enormes dificultades económicas, lo que hace que el desafío sea mucho mayor que en los relativamente benignos años 90. La buena noticia sobre la construcción de una empresa en tiempos como este es que las empresas que tienen éxito serán extremadamente fuertes y resilientes. Y cuando la economía finalmente se estabilice, esté atento: lo mejor de las nuevas empresas crecerá aún más rápido.

En segundo lugar, muchas personas en los EE. UU. y en todo el mundo carecen de la educación y las habilidades necesarias para participar en las grandes empresas nuevas que salen de la revolución del software. Esta es una tragedia, ya que cada compañía con la que trabajo está absolutamente hambrienta de talento. Los ingenieros de software, gerentes, especialistas en marketing y vendedores calificados en Silicon Valley pueden acumular docenas de ofertas de trabajo de alto salario y alto rendimiento en cualquier momento que lo deseen, mientras que el desempleo nacional y el subempleo son muy altos. Este problema es aún peor de lo que parece porque muchos trabajadores de las industrias existentes quedarán varados del lado equivocado de la interrupción basada en software y es posible que nunca puedan volver a trabajar en sus campos. No hay manera de superar este problema más allá de la educación, y tenemos un largo camino por recorrer.

Por último, las nuevas empresas deben demostrar su valor. Necesitan construir culturas sólidas, deleitar a sus clientes, establecer sus propias ventajas competitivas y, sí, justificar sus valuaciones en aumento. Nadie debería esperar que la construcción de una nueva empresa de alto crecimiento impulsada por software en una industria establecida sea fácil. Es brutalmente difícil.

Tengo el privilegio de trabajar con algunas de las mejores empresas de software, y puedo decirles que son realmente buenas en lo que hacen. Si se desempeñan según mis expectativas y las de los demás, serán compañías fundamentales altamente valiosas en la economía global, comiendo mercados mucho más grandes de lo que la industria tecnológica ha podido históricamente perseguir.

En lugar de cuestionar constantemente sus valuaciones, busquemos comprender cómo la nueva generación de empresas de tecnología está haciendo lo que hacen, cuáles son las consecuencias más amplias para las empresas y la economía y qué podemos hacer colectivamente para ampliar la cantidad de nuevas empresas de software innovadoras creadas en los EE. UU. y en todo el mundo.

Comparación de modelos DeepSeek: V3, R1 y R1-Zero

 Simranjeet Singh, 29 enero 2025,  Publicado en: Inteligencia artificial en lenguaje sencillo

DeepSeek se ha convertido en un actor destacado, en particular con sus recientes lanzamientos de los modelos R1 y V3. Este artículo tiene como objetivo proporcionar una comparación clara entre estos tres modelos: DeepSeek R1, DeepSeek V3 y DeepSeek R1-Zero. Cada modelo ofrece características y capacidades distintas que satisfacen diferentes necesidades dentro de la comunidad de IA.

DeepSeek R1 está diseñado para tareas de razonamiento avanzado, aprovechando técnicas de aprendizaje de refuerzo para mejorar su rendimiento. Por el contrario, DeepSeek V3 se centra en el procesamiento escalable del lenguaje natural mediante una arquitectura de combinación de expertos, lo que le permite gestionar de forma eficiente una variedad de aplicaciones. Por último, DeepSeek R1-Zero representa un enfoque innovador al entrenar únicamente a través del aprendizaje de refuerzo sin un ajuste fino supervisado previo.

A medida que profundizamos en la comparación, exploraremos las fortalezas y debilidades específicas de cada modelo, arrojando luz sobre sus respectivos roles en el avance de la tecnología de IA.

¿Sabes por qué DeepSeek genera tanto revuelo y cómo supera a los LLM de código cerrado que son modelos realmente de última generación?

En el informe técnico de DeepSeek V3, su arquitectura y funcionamiento. DeepSeek realmente cambió la arquitectura de los transformadores. DeepSeek ofrece cosas realmente interesantes como: atención latente de múltiples cabezas, modelo de mezcla de expertos y modelos de predicción de múltiples tokens 🤖

Propósito y diseño de los modelos

1. DeepSeek R1: se centra en tareas de razonamiento avanzado

DeepSeek R1 está diseñado para sobresalir en tareas de razonamiento complejo, utilizando técnicas avanzadas de aprendizaje por refuerzo. Este modelo es particularmente eficaz en situaciones en las que se requiere deducción lógica y resolución de problemas.

Ejemplo de entrada del mundo real:

Oración de entrada: “Si todos los humanos son mortales y Sócrates es un humano, ¿qué podemos concluir sobre Sócrates?”

Resultado esperado: “Sócrates es mortal”.

En este ejemplo, DeepSeek R1 aprovecha sus capacidades de razonamiento para extraer una conclusión lógica basada en las premisas proporcionadas. La capacidad del modelo para comprender y procesar estructuras lógicas le permite generar resultados coherentes y precisos.

2. DeepSeek V3: modelo de propósito general para el procesamiento escalable del lenguaje natural

DeepSeek V3 está diseñado para ofrecer versatilidad en tareas de procesamiento de lenguaje natural, empleando una arquitectura de combinación de expertos. Este modelo puede manejar una amplia variedad de aplicaciones, desde interacciones de servicio al cliente hasta generación de contenido.

Ejemplo de entrada del mundo real:

Oración de entrada: “Escribe un breve resumen de los beneficios de la energía renovable”.

Resultado esperado: “Las fuentes de energía renovables, como la solar y la eólica, ofrecen numerosos beneficios, entre ellos, menores emisiones de gases de efecto invernadero, menores costos de energía a largo plazo y menor dependencia de los combustibles fósiles. Contribuyen al desarrollo sostenible y ayudan a combatir el cambio climático”.

En este caso, DeepSeek V3 demuestra sus capacidades de uso general al generar un resumen claro e informativo sobre un tema relevante. Su diseño le permite procesar diversas entradas de manera eficaz y, al mismo tiempo, mantener la coherencia y la relevancia.

3. DeepSeek R1-Zero: aprendizaje de refuerzo sin ajuste fino supervisado

DeepSeek R1-Zero funciona exclusivamente con principios de aprendizaje de refuerzo sin ningún ajuste fino supervisado previo. Este modelo ha demostrado tener capacidades de razonamiento prometedoras, pero puede tener problemas de legibilidad y coherencia.

Ejemplo de entrada del mundo real:

Oración de entrada: “Explica el proceso de fotosíntesis en las plantas”.

Resultado esperado: “La fotosíntesis es el proceso mediante el cual las plantas verdes utilizan la luz solar para sintetizar alimentos con la ayuda de la clorofila de sus hojas. Convierten el dióxido de carbono del aire y el agua del suelo en glucosa y oxígeno”.

En este caso, si bien R1-Zero puede generar una explicación básica de la fotosíntesis, ocasionalmente puede producir resultados que carezcan de claridad o que contengan elementos de lenguaje mixto debido a su metodología de entrenamiento. Sin embargo, aún logra transmitir información esencial sobre el tema.

Arquitectura

1. Explicación de la arquitectura de mezcla de expertos (MoE) en V3

La arquitectura Mixture-of-Experts (MoE) es un marco sofisticado diseñado para mejorar la eficiencia y el rendimiento de los modelos de lenguaje grandes (LLM). En el contexto de DeepSeek-V3, esta arquitectura es fundamental, ya que permite que el modelo active solo un subconjunto de sus parámetros durante la inferencia, optimizando así tanto los recursos computacionales como el tiempo de respuesta.

DeepSeek-V3 cuenta con un total de 671 mil millones de parámetros, pero solo 37 mil millones se activan para cada pasada hacia adelante. Esta activación selectiva es crucial para gestionar la carga computacional y mantener niveles altos de rendimiento.

La atención latente multicabezal (MLA) reduce la sobrecarga de memoria al comprimir las claves y los valores de atención, lo que permite una inferencia eficiente sin comprometer la calidad de los mecanismos de atención 3 .

El modelo emplea un sistema de enrutamiento sofisticado que dirige las entradas a los expertos más relevantes en función de la tarea en cuestión . Este sistema garantiza que ningún experto se convierta en un cuello de botella, lo que mejora la escalabilidad y la confiabilidad.

A diferencia de las arquitecturas MoE tradicionales que dependen de pérdidas auxiliares para equilibrar la carga, DeepSeek-V3 implementa una estrategia de ajuste de sesgo dinámico. Este método permite una utilización equilibrada de expertos sin afectar negativamente el rendimiento.

La predicción de múltiples tokens (MTP) permite que el modelo prediga múltiples tokens simultáneamente, enriqueciendo la señal de entrenamiento y mejorando el rendimiento general en tareas complejas.

2. Comparación de cómo cada modelo utiliza su arquitectura para el rendimiento

Tanto DeepSeek R1 como DeepSeek R1-Zero aprovechan las capacidades avanzadas de la arquitectura DeepSeek-V3, pero difieren en su implementación y áreas de enfoque.

Búsqueda profunda R1

Arquitectura : utiliza todas las capacidades de la arquitectura Mixture-of-Experts con 671 mil millones de parámetros.

Rendimiento : Destaca en tareas de razonamiento gracias a su mecanismo de selección dinámica que activa de forma selectiva a los expertos pertinentes en función de las demandas de la consulta. Este modelo demuestra capacidades de razonamiento excepcionales manteniendo la rentabilidad.

Técnicas de capacitación : incorpora estrategias de equilibrio de carga para garantizar un rendimiento óptimo sin sobrecargar a ningún experto. El uso de activación de compuerta dispersa mejora aún más su capacidad para manejar diversas entradas de manera eficaz.

DeepSeek R1-Zero

Arquitectura : Estructura fundamental similar a R1 pero centrada en capacidades de razonamiento de disparo cero.

Rendimiento : si bien conserva la eficiencia de activar solo 37 mil millones de parámetros durante la inferencia, enfatiza la generalización en varias tareas sin necesidad de ajustes extensos o datos de entrenamiento específicos de la tarea.

Técnicas de entrenamiento : emplea estrategias de equilibrio de carga similares a las de R1, pero puede utilizar diferentes técnicas de optimización diseñadas para escenarios de cero disparos, lo que mejora su adaptabilidad a nuevas tareas sin exposición previa.

Metodología de formación

Diferencias en los enfoques de entrenamiento entre R1 y R1-Zero.

Las metodologías de entrenamiento de DeepSeek R1 y DeepSeek R1-Zero representan una evolución significativa en el enfoque de entrenamiento de modelos de lenguaje grandes (LLM). Ambos modelos utilizan técnicas innovadoras diseñadas para mejorar sus capacidades de razonamiento, pero difieren fundamentalmente en sus procesos de entrenamiento.

Búsqueda profunda R1:

Aprendizaje por refuerzo con ajuste fino supervisado: DeepSeek R1 emplea un enfoque de entrenamiento híbrido que combina el aprendizaje por refuerzo (RL) con el ajuste fino supervisado. Inicialmente, el modelo pasa por una fase de arranque en frío en la que se ajusta con un conjunto de datos seleccionados derivados de los resultados de DeepSeek R1-Zero. Esta fase garantiza que el modelo comience con datos legibles y de alta calidad, abordando así los problemas iniciales relacionados con la coherencia de los resultados.

Proceso de formación multifase:

Fase de inicio en frío: ajuste fino supervisado en un conjunto de datos pequeño pero de alta calidad.

Fase de aprendizaje de refuerzo del razonamiento: se aplica el aprendizaje reforzado a gran escala para mejorar las capacidades de razonamiento en diversas tareas.

Fase de muestreo de rechazo y ajuste fino supervisado : implica generar muestras y retener solo aquellas que sean correctas y legibles, seguido de un ajuste fino adicional.

Fase de aprendizaje de refuerzo diverso: se centra en diversas tareas, utilizando recompensas basadas en reglas para tareas específicas, como matemáticas, y retroalimentación de un LLM para otras.

DeepSeek R1-Zero:
Enfoque de aprendizaje de refuerzo puro: por el contrario, DeepSeek R1-Zero se entrena completamente a través del aprendizaje de refuerzo sin ningún ajuste fino supervisado. Este modelo utiliza un método novedoso llamado optimización de políticas relativas a grupos (GRPO), que simplifica el proceso de aprendizaje de refuerzo al eliminar la necesidad de redes críticas.
Sistema de recompensas basado en reglas: el entrenamiento incorpora reglas predefinidas para calcular recompensas basadas en la precisión y el formato de respuesta, lo que hace que requiera menos recursos y al mismo tiempo logre un sólido desempeño en varios puntos de referencia.
Muestreo impulsado por la exploración : esta técnica diversifica las rutas de aprendizaje, lo que permite que el modelo se adapte a nuevos escenarios de manera efectiva, lo que da como resultado capacidades de razonamiento emergentes.



Descripción general de la eficiencia de la capacitación y los requisitos de recursos

Búsqueda profunda R1:
Requisitos de recursos : el enfoque híbrido requiere más recursos computacionales debido a su proceso de entrenamiento multifase, que incluye tanto aprendizaje supervisado como aprendizaje automático. Sin embargo, esta inversión da como resultado una mejor legibilidad y coherencia de los resultados.
Eficiencia del entrenamiento: si bien puede requerir muchos recursos, el uso estratégico de conjuntos de datos de alta calidad durante la fase de inicio en frío mejora la eficiencia general del entrenamiento al proporcionar una base sólida para las fases de RL posteriores.

DeepSeek R1-Zero:
Requisitos de recursos: el enfoque de capacitación basado exclusivamente en RL está diseñado para ser más rentable. Al utilizar recompensas basadas en reglas en lugar de modelos críticos complejos, R1-Zero reduce significativamente la sobrecarga computacional en comparación con los métodos de RL tradicionales.

Eficiencia del entrenamiento: A pesar de su simplicidad, este modelo logra un rendimiento competitivo en varios parámetros de referencia, lo que demuestra que se puede lograr un entrenamiento eficaz sin necesidad de realizar ajustes finos supervisados. El muestreo basado en la exploración mejora aún más su adaptabilidad sin incurrir en altos costos de recursos.


https://ai.plainenglish.io/deepseek-models-compared-v3-r1-r1-zero-complete-guide-194abf94ac54







C: la clave para el futuro digital

 Jeroni de Marcombo

Si hay un lenguaje de programación que ha resistido el paso del tiempo y sigue siendo clave en la tecnología actual, ese es C. Desde sistemas operativos hasta inteligencia artificial y blockchain, C es el motor que impulsa gran parte del software y la infraestructura digital que usamos a diario.


Desarrollado en los años 70 por Dennis Ritchie en los laboratorios Bell, su primer gran uso fue en la reescritura de UNIX, y desde entonces, su influencia ha sido incuestionable. Muchos lenguajes modernos, como C++, Java y Python, derivan de su sintaxis y estructura. Su aplicación es casi omnipresente: está en sistemas operativos como Windows y Linux, en hardware y sistemas embebidos, en aplicaciones de alto rendimiento utilizadas en fintechs y plataformas como Google, y en la base de la tecnología blockchain, donde las librerías criptográficas están implementadas en C para garantizar velocidad y seguridad. También es clave en la computación científica, con aplicaciones en física cuántica y aeroespacial, así como en modelos financieros empleados por gigantes como Bloomberg y Morgan Stanley.

Conocer C te da acceso a las bases de la programación y te prepara para entender cómo funcionan los sistemas informáticos desde dentro. Aprenderlo significa tener control absoluto sobre la memoria y los procesos del sistema, adquirir conocimientos transferibles a otros lenguajes modernos y desarrollar software con alto rendimiento y seguridad. Además, abre oportunidades en campos como la inteligencia artificial, blockchain y tecnologías emergentes.