• Equipo Editorial
  • Boletín Semanal
  • Contacto
  • Cursos
  • Publicidad
  • Store
viernes, junio 19, 2026
Espacio Tech
  • Revistas
  • Exploración
  • Espacial
  • Tecnología
  • Exclusivo
  • EM
  • ZM
  • EE
Sin resultados
Ver todos los resultados
Espacio Tech
  • Revistas
  • Exploración
  • Espacial
  • Tecnología
  • Exclusivo
  • EM
  • ZM
  • EE
Sin resultados
Ver todos los resultados
Espacio Tech
Sin resultados
Ver todos los resultados
Inicio Tecnología e Innovación IA y automatización

OpenAI Lanza Crawler para Recopilar Datos

Redacción Espacio Tech Por Redacción Espacio Tech
11 abril, 2026
en IA y automatización
Tiempo de lectura:3 minutos de lectura
0
Comparte en FacebookComparte en TwitterCompartilo en Whatsapp
+ AGREGANOS COMO FAVORITOS EN Google ¿Por qué añadirnos? Recibe lo ultimo de Espacio Tech en tu feed de Google.

OpenAI ha lanzado un nuevo web crawler llamado “GPTBot” que recorrerá Internet en busca de contenido para entrenar a sus grandes modelos de lenguaje como GPT-4, que potencian a ChatGPT.

“Permitir que GPTBot acceda a su sitio puede ayudar a que los modelos de IA sean más precisos y mejoren sus capacidades y seguridad en general”, dice una publicación en el sitio web de OpenAI.

Te puede interesar

China construye la primera estación de energía prefabricada para centros de datos de IA

Milei invita a “liberar” la inteligencia artificial y propone crear empresas no humanas en la Argentina

Un estudio argentino afirma que el país necesita una estrategia de IA para no quedar rezagado

El gigante de la IA también afirma que GPTBot está “filtrado” para eliminar fuentes de pago, información personalmente identificable y texto que viole sus políticas.

Afortunadamente, OpenAI proporciona una manera fácil de bloquear GPTBot al agregar una entrada en el archivo robot.txt de un sitio web, un archivo que le dice a los web crawlers de motores de búsqueda como Google a qué pueden acceder.

Además, los administradores pueden personalizar qué partes de sus sitios GPTBot puede recorrer. Sus múltiples direcciones IP también están disponibles para un bloqueo fácil.

¡Manténganse Fuera! Hasta ahora, los grandes modelos de lenguaje detrás de ChatGPT se entrenaron con enormes cantidades de datos en línea recopilados hasta septiembre de 2021.

No hay forma de eliminar retroactivamente los datos que se recopilaron antes de esa fecha límite, pero bloquear su nuevo web crawler al menos protegerá a los sitios web que quieran mantenerlo fuera en el futuro.

Y puedes apostar a que muchos propietarios de sitios, que probablemente no estén interesados en que su contenido sea recopilado e imitado por una IA, ya están aprovechando esto.

Un ejemplo es la popular revista de ciencia ficción Clarkesworld, que anunció en X, antes conocido como Twitter, que estaba bloqueando a GPTBot.

El medio tecnológico The Verge ha hecho lo mismo en silencio, y ya están circulando innumerables artículos que brindan consejos sobre cómo bloquear al crawler.

Bichos Extraños Por supuesto, los web crawlers son, para bien o para mal, el alma de Internet moderno y no son nada nuevo. En muchos casos, se anima a los sitios web a permitir que los crawlers de Google y otros motores de búsqueda accedan para ayudar a aumentar su tráfico web.

Sin embargo, ahora muchos consideran que tenerlos recopilando datos para entrenar IA generativa es ir demasiado lejos.

Por ejemplo, una demanda reciente contra OpenAI argumenta que, dado que su chatbot se entrena con la escritura de todos sin permiso, desde libros hasta artículos disponibles en línea, constituye robo.

El hecho de que OpenAI haya seguido adelante y anunciado a GPTBot a pesar de la demanda podría sugerir que no está preocupada por su resultado. Por otro lado, al dar a los sitios web la opción de bloquear al crawler, también podría estar cubriendo sus huellas.

Etiquetas: ChatGPT
Redacción Espacio Tech

Redacción Espacio Tech

Redacción Espacio Tech es el equipo de periodistas y especialistas del portal, enfocado en tecnología, innovación, ciberseguridad y sector espacial, con énfasis en el cruce entre desarrollo tecnológico, defensa y seguridad.

Noticias relacionadas

Imagen de la primera estación de energía prefabricada, destinada a generación y almacenamiento de datos de la IA.

China construye la primera estación de energía prefabricada para centros de datos de IA

Por Redacción Espacio Tech
11 junio, 2026
0

La empresa china TGOOD Electric ha desarrollado en Qingdao, provincia oriental china de Shandong, ha puesto en funcionamiento la primera...

Javier Milei

Milei invita a “liberar” la inteligencia artificial y propone crear empresas no humanas en la Argentina

Por Redacción Espacio Tech
4 junio, 2026
0

El presidente Javier Milei presentó en el Financial Times una de las apuestas más disruptivas de su agenda económica y...

Argentina 2035: un estudio advierte que el país necesita una estrategia nacional de Inteligencia Artificial para no quedar rezagado en la región

Un estudio argentino afirma que el país necesita una estrategia de IA para no quedar rezagado

Por Redacción Espacio Tech
3 junio, 2026
0

Un equipo interdisciplinario de investigadores argentinos de la Universidad Austral, CONICET y la Universidad Católica de Santa Fe ha presentado el...

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Más leidas

Este miércoles 17 de junio, la instalación recibió 6 toneladas de agua pesada grado reactor, que serán utilizadas en el tanque reflector.

El nuevo reactor nuclear RA-10 avanza hacia su puesta en marcha: la CNEA recibió 6 toneladas de agua pesada en el Centro Atómico Ezeiza

18 junio, 2026
Investigadores del CONICET integrarán HERON, una iniciativa financiada por la Unión Europea que busca crear nuevos dispositivos electrónicos para computación neuromórfica.

Científicos argentinos participarán en HERON, un proyecto europeo para desarrollar IA de bajo consumo inspirada en el cerebro

19 junio, 2026
Brasil acelera su programa espacial con nuevos acuerdos para un microlanzador propio y propulsión líquida.

Brasil acelera su programa espacial con nuevos acuerdos para un microlanzador propio y propulsión líquida

19 junio, 2026
Imagen de las aeronaves semiautónomas FQ-44 de la empresa Anduril. Fuerza aérea Anduril

La Fuerza Aérea de EE.UU. selecciona el FQ-44 de Anduril para iniciar su producción en serie dentro del programa de drones wingman

18 junio, 2026
La startup china Spark Space prueba su motor eléctrico y consigue nuevas rondas de financiamiento.

La startup china Spark Space prueba su motor eléctrico y consigue nuevas rondas de financiamiento

19 junio, 2026

Lo último

El Ejército de Estados Unidos crea la Fuerza de Tarea Conjunta Interagencial-401 (JIATF-401) analizó cómo proteger las comunicaciones, el suministro eléctrico y las capacidades de despliegue logístico. guerra híbrida

¿Cómo funcionan las defensas híbridas ante amenazas de drones? El Ejército de EE. UU. evalúa este sistema en sus infraestructuras críticas

19 junio, 2026
El Consejo Nacional de Ciencia, Tecnología e Innovación (Concytec) se ha incorporado formalmente a la nueva Comisión Multisectorial de Desarrollo Productivo (CMDP).

Perú, a través del Concytec, se suma a una comisión para desarrollo productivo, innovación e IA

19 junio, 2026
Representantes de las instituciones en la firma del Memorando de Entendimiento. Crédito: AEB. aeroespacial Brasil

La Agencia Espacial Brasileña y la Universidad de Brasilia impulsan un hub espacial

19 junio, 2026
Brasil acelera su programa espacial con nuevos acuerdos para un microlanzador propio y propulsión líquida.

Brasil acelera su programa espacial con nuevos acuerdos para un microlanzador propio y propulsión líquida

19 junio, 2026
Investigadores del CONICET integrarán HERON, una iniciativa financiada por la Unión Europea que busca crear nuevos dispositivos electrónicos para computación neuromórfica.

Científicos argentinos participarán en HERON, un proyecto europeo para desarrollar IA de bajo consumo inspirada en el cerebro

19 junio, 2026
Espacio Tech

© Espacio Tech© es una marca Blue Field Media. Todos los derechos reservados. Registro DNDA 02986459.

Sobre Nosotros

  • Equipo editorial
  • Contacto
  • Política ética y principios editoriales
  • Términos y Condiciones
  • Política de privacidad

Seguinos

Sin resultados
Ver todos los resultados
  • Store
  • Campus Virtual
  • Espacio Tech
  • Argentina
  • Equipo editorial
  • Contacto
  • Boletines
  • Zona Militar
  • Escenario Mundial
  • El Estratégico
  • Stratbridge
  • Editorial BFM

© Espacio Tech© es una marca Blue Field Media. Todos los derechos reservados. Registro DNDA 02986459.