OpenAI presentó hace una semana una nueva característica para ChatGPT llamado «memoria,» que almacena cosas a las que usted le pide explícitamente al programa que tenga acceso, para su uso posterior.
Además de la memoria, es bueno recordar que ChatGPT también puede utilizar las capacidades de carga de archivos existentes para analizar texto e imágenes. Simplemente arrastre y suelte un archivo en la ventana de chat, como un PDF o un JPEG, agregue un mensaje si lo desea y ChatGPT comenzará a producir una salida de texto basada en lo que haya subido.
También: Cómo utilizar ChatGPT
La capacidad está disponible para todos los usuarios que pagan el servicio de 20 dólares al mes.Más«. La versión Plus tiene la capacidad adicional de usar el último ChatGPT, versión 4, en lugar de la versión 3.5, y la calidad de salida puede ser notablemente mejor. Plus también permite el uso de DARLEel programa de generación de imágenes.
Los usos más obvios para la carga de archivos son el resumen, la descripción y tipos más avanzados de búsqueda semántica más allá de la búsqueda de palabras clave. Cargar archivos es fácil: simplemente arrástrelos.
La función de carga de archivos brilla cuando se le presenta un documento largo y se le pide que haga algo como aislar temáticamente tipos particulares de contenido. Esta es una forma de búsqueda semántica, es decir, que no se basa estrictamente en una palabra clave individual.
Por ejemplo, subí un informe de 4.500 palabras sobre semiconductores especializados conocidos como carburo de silicio. El carburo de silicio se utiliza ampliamente en Tesla y otros vehículos eléctricos para crear lo que se llama inversor de tracción. Pero tiene aplicaciones menos obvias. Le pregunté a ChatGPT: «En este informe sobre carburo de silicio, ¿hay alguna referencia a casos de uso no automotrices?»
También: Los mejores chatbots con IA
ChatGPT respondió con un excelente resumen de seis casos de uso que se identificaron en el informe y no pertenecían a automóviles. Esto es más poderoso que tener que utilizar palabras clave individuales. He considerado usar ChatGPT como mi fuente de referencia para dar un primer paso al trabajar con documentos largos.
El resumen textual es útil para transcripciones largas de entrevistas. Subí una transcripción de 6800 palabras y obtuve un resumen útil de los temas más importantes que podría ser el comienzo de un esquema para una entrevista basada en la transcripción.
Sin embargo, dichos resúmenes no reemplazan la edición y la configuración de una historia. Ese tipo de compresión de datos requiere identificar temas, reformularlos de manera útil y, lo más importante, decidir qué cosas omitir. Esas cosas, especialmente qué omitir, actualmente están más allá de lo que ChatGPT puede hacer, aunque tipos más particulares de indicaciones pueden ayudar.
El análisis de archivos de ChatGPT puede manejar archivos de imágenes, pero aún no videos. Cuando se cargan varias imágenes, el programa hace un trabajo satisfactorio al identificar los contenidos e incluso agregar alguna copia descriptiva. Esto puede resultar útil para cosas como los subtítulos.
También: Los mejores generadores de imágenes con IA
ChatGPT identificó el horizonte de la ciudad de Nueva York, el Empire State Building, y comentó sobre la combinación de estilos antiguos y nuevos.
Una escena callejera en el centro de Manhattan también evocó una útil leyenda descriptiva de la máquina.
Pude enviar una obra de arte basada en una imagen de dominio público de Alan Turing, a quien el programa identificó, y anoté con comentarios sobre la intención de la imagen.
ChatGPT ofreció una descripción apropiada, aunque insulsa, de la foto de ZDNET de los ejecutivos de OpenAI Sam Altman y Mira Murati de un artículo sobre los dos de noviembresin identificar realmente a los individuos.
La capacidad de la IA para analizar imágenes y vídeos está evolucionando rápidamente. Google del alfabeto presentó recientemente su último modelo de lenguaje grande, Géminis 1.5. El programa puede concentrarse en el momento en una transcripción de 440 páginas de la misión Apolo a la luna cuando Neil Armstrong da «un pequeño paso» en la superficie de la luna. También pudo detectar marcas de tiempo en una película muda de Buster Keaton. Ese tipo de capacidades aún están más allá de la precisión de la carga de archivos de ChatGPT.
También: ¿Qué es Géminis? Todo lo que debes saber sobre el nuevo modelo de IA de Google
Está claro que el análisis de documentos se fusionará con la función de memoria en ChatGPT en algún momento. Escribir recuerdos a mano cuando se le solicita no es necesariamente tan eficiente como proporcionar un documento completo que tenga todo lo que uno desea aplicar a ChatGPT, como referencias e información general. Dentro de un año, el uso de la memoria y el análisis probablemente será una de las principales formas en que ChatGPT habrá evolucionado desde su encarnación actual.