Reddit: la mina de oro de datos para la IA

19/04/2023

Reddit

Reddit se ha convertido en una plataforma popular para discusiones en línea sobre una variedad de temas. A diario, más de 57 millones de personas se unen a las conversaciones, lo que hace que sea una de las plataformas de discusión más grandes del mundo. En los últimos años, la plataforma se ha vuelto popular no solo por sus conversaciones bizarros sino también por ser una mina de oro de datos para entrenar inteligencias artificiales.

Empresas como Google, OpenAI y Microsoft han utilizado los mensajes disponibles en la plataforma para entrenar sus modelos de IA, revela The New York Times. Reddit ha decidido aprovechar la oportunidad y comenzar a cobrar a las empresas que quieran acceder a su API, lo que permitirá el procesamiento de grandes cantidades de conversaciones y el entrenamiento de modelos de IA.

Reddit
Reddit

¿Por qué Reddit es tan valioso para la IA?

Reddit es una plataforma de discusión en línea, lo que significa que contiene una gran cantidad de datos generados por usuarios. Los usuarios publican miles de conversaciones diariamente, lo que se traduce en una enorme cantidad de datos para entrenar modelos de IA. A diferencia de otras redes sociales, es anónimo y no requiere la identificación de los usuarios. Esto significa que los datos disponibles en la plataforma son más auténticos y no están sesgados por la información personal de los usuarios.

Las empresas quieren entrenar sus modelos de IA con datos de Reddit

Google, OpenAI y Microsoft son solo algunas de las empresas que han utilizado los datos de la red social para entrenar sus modelos de IA. Los responsables de desarrollo de Google Bard y OpenAI LLM ya han citado a Reddit como una de sus fuentes de datos de entrenamiento. Shutterstock llegó a un acuerdo con OpenAI para que DALL-E fuera entrenado con su base de datos de imágenes. Incluso el CEO de Reddit, Steve Huffman, ha señalado que el núcleo de los datos de Reddit es valioso para el entrenamiento de modelos de IA.

Reddit quiere sacar partido de sus datos

La empresa se está preparando para una potencial salida a bolsa y, por lo tanto, quiere sacar partido de sus datos. El modelo publicitario actual de la empresa no es suficiente para sostener su negocio, por lo que Reddit ha decidido comenzar a cobrar a las empresas que quieran acceder a su API. El acceso a la API permitirá el procesamiento de grandes cantidades de conversaciones y el entrenamiento de modelos de IA. El CEO de Reddit ha dicho que no es justo que algunas de las empresas más grandes del mundo tengan acceso gratuito a los valiosos datos de Reddit sin devolver nada a los usuarios.

Reddit
Reddit

¿Cómo afectará esto a los usuarios?

Aunque los desarrolladores pueden seguir utilizando la API de Reddit de forma gratuita para propósitos no comerciales y académicos, las empresas tendrán que pagar. Algunos usuarios han expresado su preocupación de que la empresa se esté aprovechando de los datos que ellos mismos han generado sin ofrecerles nada a cambio. La empresa ha indicado que los usuarios seguirán teniendo acceso a la plataforma de forma gratuita y que solo se cobrará por el acceso a la API.

Reddit
Reddit

En resumen, Reddit está utilizando los datos de sus usuarios para entrenar IA y está considerando cobrar a las empresas que deseen acceder a su API para descargar y procesar grandes cantidades de conversaciones. Esto podría ser útil para su modelo publicitario y una posible salida a bolsa. Aunque la API será gratuita para algunos desarrolladores, Reddit se ha encontrado en el centro de un debate sobre la justicia de cobrar por los datos que los usuarios han generado.

Si quieres conocer otros artículos parecidos a Reddit: la mina de oro de datos para la IA puedes visitar la categoría Inteligencia Artificial.

También te puede interesar

Subir