• Equipo Editorial
  • Boletín Semanal
  • Contacto
  • Cursos
  • Publicidad
  • Store
martes, marzo 10, 2026
Espacio Tech
  • Revistas
  • Exploración
  • Tecnología
  • Innovación
  • Exclusivo
  • EM
  • ZM
  • EE
Sin resultados
Ver todos los resultados
Espacio Tech
  • Revistas
  • Exploración
  • Tecnología
  • Innovación
  • Exclusivo
  • EM
  • ZM
  • EE
Sin resultados
Ver todos los resultados
Espacio Tech
Sin resultados
Ver todos los resultados
Inicio Tecnología e Innovación Inteligencia Artificial

OpenAI Lanza Crawler para Recopilar Datos

Redacción Espacio Tech Por Redacción Espacio Tech
21 agosto, 2023
en Inteligencia Artificial
Tiempo de lectura:3 minutos de lectura
0
Comparte en FacebookComparte en TwitterCompartilo en Whatsapp

OpenAI ha lanzado un nuevo web crawler llamado “GPTBot” que recorrerá Internet en busca de contenido para entrenar a sus grandes modelos de lenguaje como GPT-4, que potencian a ChatGPT.

“Permitir que GPTBot acceda a su sitio puede ayudar a que los modelos de IA sean más precisos y mejoren sus capacidades y seguridad en general”, dice una publicación en el sitio web de OpenAI.

Te puede interesar

Amazon endurece sus controles después de que la IA generativa tome decisiones autónomas y genere fallas en sus sistemas

Polémica con los lentes Meta de Ray-Ban: trabajadores denuncian “videos perturbadores” en revisiones humanas

Argentina lanzó la convocatoria “Economía del Conocimiento con aplicación de IA” para fomentar soluciones tecnológicas para el ecosistema productivo

El gigante de la IA también afirma que GPTBot está “filtrado” para eliminar fuentes de pago, información personalmente identificable y texto que viole sus políticas.

Afortunadamente, OpenAI proporciona una manera fácil de bloquear GPTBot al agregar una entrada en el archivo robot.txt de un sitio web, un archivo que le dice a los web crawlers de motores de búsqueda como Google a qué pueden acceder.

Además, los administradores pueden personalizar qué partes de sus sitios GPTBot puede recorrer. Sus múltiples direcciones IP también están disponibles para un bloqueo fácil.

¡Manténganse Fuera! Hasta ahora, los grandes modelos de lenguaje detrás de ChatGPT se entrenaron con enormes cantidades de datos en línea recopilados hasta septiembre de 2021.

No hay forma de eliminar retroactivamente los datos que se recopilaron antes de esa fecha límite, pero bloquear su nuevo web crawler al menos protegerá a los sitios web que quieran mantenerlo fuera en el futuro.

Y puedes apostar a que muchos propietarios de sitios, que probablemente no estén interesados en que su contenido sea recopilado e imitado por una IA, ya están aprovechando esto.

Un ejemplo es la popular revista de ciencia ficción Clarkesworld, que anunció en X, antes conocido como Twitter, que estaba bloqueando a GPTBot.

El medio tecnológico The Verge ha hecho lo mismo en silencio, y ya están circulando innumerables artículos que brindan consejos sobre cómo bloquear al crawler.

Bichos Extraños Por supuesto, los web crawlers son, para bien o para mal, el alma de Internet moderno y no son nada nuevo. En muchos casos, se anima a los sitios web a permitir que los crawlers de Google y otros motores de búsqueda accedan para ayudar a aumentar su tráfico web.

Sin embargo, ahora muchos consideran que tenerlos recopilando datos para entrenar IA generativa es ir demasiado lejos.

Por ejemplo, una demanda reciente contra OpenAI argumenta que, dado que su chatbot se entrena con la escritura de todos sin permiso, desde libros hasta artículos disponibles en línea, constituye robo.

El hecho de que OpenAI haya seguido adelante y anunciado a GPTBot a pesar de la demanda podría sugerir que no está preocupada por su resultado. Por otro lado, al dar a los sitios web la opción de bloquear al crawler, también podría estar cubriendo sus huellas.

Etiquetas: ChatGPT
Redacción Espacio Tech

Redacción Espacio Tech

Redacción Espacio Tech es el equipo de periodistas y especialistas del portal, enfocado en tecnología, innovación, ciberseguridad y sector espacial, con énfasis en el cruce entre desarrollo tecnológico, defensa y seguridad.

Noticias relacionadas

Amazon endurece sus controles después de que la IA generativa tome decisiones autónomas y genere fallas en sus sistemas.

Amazon endurece sus controles después de que la IA generativa tome decisiones autónomas y genere fallas en sus sistemas

Por Redacción Espacio Tech
10 marzo, 2026
0

Amazon decidió endurecer los controles sobre el uso de inteligencia artificial para programar después de detectar varios incidentes y caídas...

Polémica con los lentes Meta de Ray-Ban: trabajadores denuncian “videos perturbadores” en revisiones humanas

Por Redacción Espacio Tech
4 marzo, 2026
0

En los últimos días volvió a crecer el debate sobre la privacidad de los lentes inteligentes Meta de Ray-Ban. El...

La Agencia I+D+i lanzó la convocatoria “Economía del Conocimiento con aplicación de IA” para consorcios con foco productivo y exportador.

Argentina lanzó la convocatoria “Economía del Conocimiento con aplicación de IA” para fomentar soluciones tecnológicas para el ecosistema productivo

Por Redacción Espacio Tech
28 febrero, 2026
0

La Agencia Nacional de Promoción de la Investigación, el Desarrollo Tecnológico y la Innovación (Agencia I+D+i) abrió una nueva convocatoria...

Deja un comentario Cancelar respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Más leidas

Irán se burló de EE.UU. y afirmó que su dron kamikaze LUCAS es una "copia sin licencia" del iraní Shahed.

Irán se burló de EE.UU. y afirmó que su dron kamikaze LUCAS es una “copia sin licencia” del iraní Shahed-136

3 marzo, 2026
Tomahawk, los misiles que Estados Unidos está usando en la escalada con Irán. Crédito: U.S. Navy.

Los misiles Tomahawk que Estados Unidos está usando en la ofensiva contra Irán

1 marzo, 2026
La Fuerza Espacial lanzó el Minuteman III GT-255 con dos vehículos de reentrada en plena transición hacia el misil Sentinel.

La Fuerza Espacial de EE.UU. lanzó el misil balístico Minuteman III con dos vehículos de reentrada desde California

4 marzo, 2026
DARPA presenta el avión experimental X-76 que vuela rápido y despega sin pista.

DARPA presenta el avión experimental X-76 que vuela rápido y despega sin pista

9 marzo, 2026

Un influencer difundió videos explicando cómo despegar un caza F-16 “por si resulta útil”

3 marzo, 2026

Lo último

Amazon endurece sus controles después de que la IA generativa tome decisiones autónomas y genere fallas en sus sistemas.

Amazon endurece sus controles después de que la IA generativa tome decisiones autónomas y genere fallas en sus sistemas

10 marzo, 2026
China prepara el lanzamiento de la sonda Chang’e-7 para buscar agua en el polo sur de la Luna.

China prepara el lanzamiento de la sonda Chang’e-7 para buscar agua en el polo sur de la Luna

10 marzo, 2026

Argentina discutió su agenda digital y espacial con el Council of the Americas en Nueva York

10 marzo, 2026
DARPA presenta el avión experimental X-76 que vuela rápido y despega sin pista.

DARPA presenta el avión experimental X-76 que vuela rápido y despega sin pista

9 marzo, 2026
China traslada el Long March-8A a la rampa y se prepara para un nuevo lanzamiento.

China traslada el Long March-8A a la rampa y se prepara para un nuevo lanzamiento

9 marzo, 2026
Espacio Tech

© Espacio Tech© es una marca Blue Field Media. Todos los derechos reservados. Registro DNDA 02986459.

Sobre Nosotros

  • Equipo editorial
  • Contacto
  • Política ética y principios editoriales
  • Términos y Condiciones
  • Política de privacidad

Seguinos

Sin resultados
Ver todos los resultados
  • Store
  • Campus Virtual
  • Espacio Tech
  • Argentina
  • Equipo editorial
  • Contacto
  • Boletines
  • Zona Militar
  • Escenario Mundial
  • El Estratégico
  • Stratbridge
  • Editorial BFM

© Espacio Tech© es una marca Blue Field Media. Todos los derechos reservados. Registro DNDA 02986459.