• Equipo Editorial
  • Boletín Semanal
  • Contacto
  • Cursos
  • Publicidad
  • Store
miércoles, marzo 18, 2026
Espacio Tech
  • Revistas
  • Exploración
  • Tecnología
  • Innovación
  • Exclusivo
  • EM
  • ZM
  • EE
Sin resultados
Ver todos los resultados
Espacio Tech
  • Revistas
  • Exploración
  • Tecnología
  • Innovación
  • Exclusivo
  • EM
  • ZM
  • EE
Sin resultados
Ver todos los resultados
Espacio Tech
Sin resultados
Ver todos los resultados
Inicio Tecnología e Innovación IA y automatización

OpenAI Lanza Crawler para Recopilar Datos

Redacción Espacio Tech Por Redacción Espacio Tech
21 agosto, 2023
en IA y automatización
Tiempo de lectura:3 minutos de lectura
0
Comparte en FacebookComparte en TwitterCompartilo en Whatsapp

OpenAI ha lanzado un nuevo web crawler llamado “GPTBot” que recorrerá Internet en busca de contenido para entrenar a sus grandes modelos de lenguaje como GPT-4, que potencian a ChatGPT.

“Permitir que GPTBot acceda a su sitio puede ayudar a que los modelos de IA sean más precisos y mejoren sus capacidades y seguridad en general”, dice una publicación en el sitio web de OpenAI.

Te puede interesar

La Armada de EE.UU. adjudica a Gecko Robotics su mayor contrato de robótica – robots trepadores e IA para inspeccionar 18 buques de la Flota del Pacífico

China expone movimientos militares de EE.UU. en Medio Oriente con imágenes satelitales e IA

Elon Musk pidió cautela luego de que la IA generativa tomara decisiones autónomas y generara fallas en Amazon

El gigante de la IA también afirma que GPTBot está “filtrado” para eliminar fuentes de pago, información personalmente identificable y texto que viole sus políticas.

Afortunadamente, OpenAI proporciona una manera fácil de bloquear GPTBot al agregar una entrada en el archivo robot.txt de un sitio web, un archivo que le dice a los web crawlers de motores de búsqueda como Google a qué pueden acceder.

Además, los administradores pueden personalizar qué partes de sus sitios GPTBot puede recorrer. Sus múltiples direcciones IP también están disponibles para un bloqueo fácil.

¡Manténganse Fuera! Hasta ahora, los grandes modelos de lenguaje detrás de ChatGPT se entrenaron con enormes cantidades de datos en línea recopilados hasta septiembre de 2021.

No hay forma de eliminar retroactivamente los datos que se recopilaron antes de esa fecha límite, pero bloquear su nuevo web crawler al menos protegerá a los sitios web que quieran mantenerlo fuera en el futuro.

Y puedes apostar a que muchos propietarios de sitios, que probablemente no estén interesados en que su contenido sea recopilado e imitado por una IA, ya están aprovechando esto.

Un ejemplo es la popular revista de ciencia ficción Clarkesworld, que anunció en X, antes conocido como Twitter, que estaba bloqueando a GPTBot.

El medio tecnológico The Verge ha hecho lo mismo en silencio, y ya están circulando innumerables artículos que brindan consejos sobre cómo bloquear al crawler.

Bichos Extraños Por supuesto, los web crawlers son, para bien o para mal, el alma de Internet moderno y no son nada nuevo. En muchos casos, se anima a los sitios web a permitir que los crawlers de Google y otros motores de búsqueda accedan para ayudar a aumentar su tráfico web.

Sin embargo, ahora muchos consideran que tenerlos recopilando datos para entrenar IA generativa es ir demasiado lejos.

Por ejemplo, una demanda reciente contra OpenAI argumenta que, dado que su chatbot se entrena con la escritura de todos sin permiso, desde libros hasta artículos disponibles en línea, constituye robo.

El hecho de que OpenAI haya seguido adelante y anunciado a GPTBot a pesar de la demanda podría sugerir que no está preocupada por su resultado. Por otro lado, al dar a los sitios web la opción de bloquear al crawler, también podría estar cubriendo sus huellas.

Etiquetas: ChatGPT
Redacción Espacio Tech

Redacción Espacio Tech

Redacción Espacio Tech es el equipo de periodistas y especialistas del portal, enfocado en tecnología, innovación, ciberseguridad y sector espacial, con énfasis en el cruce entre desarrollo tecnológico, defensa y seguridad.

Noticias relacionadas

La Fuerza de Guerra de Minas completa todas las evoluciones programadas en Iron Fist 26. Crédito: Flota del Pacífico de la Armada de EE.UU. vía X

La Armada de EE.UU. adjudica a Gecko Robotics su mayor contrato de robótica – robots trepadores e IA para inspeccionar 18 buques de la Flota del Pacífico

Por Redacción Espacio Tech
18 marzo, 2026
0

La Armada de Estados Unidos y la Administración de Servicios Generales (GSA) adjudicaron a Gecko Robotics un contrato IDIQ a...

China expone movimientos militares de EE.UU. en Medio Oriente con imágenes satelitales e IA

China expone movimientos militares de EE.UU. en Medio Oriente con imágenes satelitales e IA

Por Redacción Espacio Tech
16 marzo, 2026
0

Una startup china de inteligencia artificial quedó en el centro de la escena internacional tras publicar imágenes satelitales casi en...

Elon Musk pidió cautela con la IA tras las fallas de Amazon por cambios de software asistidos.

Elon Musk pidió cautela luego de que la IA generativa tomara decisiones autónomas y generara fallas en Amazon

Por Redacción Espacio Tech
11 marzo, 2026
0

Elon Musk volvió a meterse en el debate sobre la inteligencia artificial, pero esta vez a partir de un caso...

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Más leidas

Tras 50 años en servicio, EE.UU. retirará al portaaviones USS Nimitz y puede utilizar sus reactores para alimentar centros de datos de IA.

Tras 50 años en servicio, EE.UU. retirará al portaaviones USS Nimitz y puede utilizar sus reactores para alimentar centros de datos de IA

11 marzo, 2026

Irán usó por primera vez su misil Sejjil durante nuevos ataques contra Israel

16 marzo, 2026
La Armada británica comprará 20 embarcaciones no tripuladas para acelerar su transición hacia una flota híbrida.

La Armada británica comprará embarcaciones no tripuladas para acelerar su transición hacia una flota híbrida

12 marzo, 2026
Hezbolá combinó drones y cohetes en su mayor ataque contra Israel, el 12 de marzo de 2026.

Hezbolá combinó drones y cohetes en su mayor ataque contra Israel: ¿qué tecnología utiliza el grupo?

13 marzo, 2026
Un instructor de la empresa ucraniana General Cherry demuestra el funcionamiento de un dron interceptor antiaéreo diseñado para destruir drones rusos en la región de Kiev, el 11 de marzo de 2026.

Ucrania negocia con EE.UU. un acuerdo de drones antiaéreos para frenar a Rusia, en medio de la escalada con Irán

14 marzo, 2026

Lo último

El C-RAM Centurion es un escudo anti-drones que EE.UU. desplegó en Medio Oriente.

Atacan a la embajada de EE.UU. en Irak: así responde el escudo antidrones C-RAM Centurion

18 marzo, 2026
Europa entra en la carrera por los domos de defensa: Leonardo y Thales impulsan escudos multicapa frente a drones y misiles.

Europa entra en la carrera por los domos de defensa: Leonardo y Thales impulsan escudos multicapa frente a drones y misiles

18 marzo, 2026
Río Negro amplía su tecnología para detectar incendios con un nuevo avión instrumentado de INVAP.

Río Negro amplía su tecnología para detectar incendios con un nuevo avión instrumentado de INVAP

18 marzo, 2026
La Fuerza de Guerra de Minas completa todas las evoluciones programadas en Iron Fist 26. Crédito: Flota del Pacífico de la Armada de EE.UU. vía X

La Armada de EE.UU. adjudica a Gecko Robotics su mayor contrato de robótica – robots trepadores e IA para inspeccionar 18 buques de la Flota del Pacífico

18 marzo, 2026
Grafica de la presentación del Golden Dome en la Casa Blanca. Crédito: archivo

El costo del Golden Dome sube de US$10.000 millones a US$185.000 millones, pero expertos advierten que podría superar el billón de dólares

17 marzo, 2026
Espacio Tech

© Espacio Tech© es una marca Blue Field Media. Todos los derechos reservados. Registro DNDA 02986459.

Sobre Nosotros

  • Equipo editorial
  • Contacto
  • Política ética y principios editoriales
  • Términos y Condiciones
  • Política de privacidad

Seguinos

Sin resultados
Ver todos los resultados
  • Store
  • Campus Virtual
  • Espacio Tech
  • Argentina
  • Equipo editorial
  • Contacto
  • Boletines
  • Zona Militar
  • Escenario Mundial
  • El Estratégico
  • Stratbridge
  • Editorial BFM

© Espacio Tech© es una marca Blue Field Media. Todos los derechos reservados. Registro DNDA 02986459.