OpenAI presenta un agente de ‘cámara’ que maneja tareas web

Operai presentó el jueves un software de inteligencia sintético llamado “cámara” que puede tender a tareas en diámetro, como ordenar artículos o completar formularios.

El cámara puede inquirir páginas web e interactuar con ellas escribiendo, haciendo clic o desplazando la forma en que una persona podría, según OpenAI.

“Se le puede pedir al cámara que maneje una amplia variedad de tareas repetitivas de navegador, como completar formularios, ordenar comestibles e incluso crear memes”, dijo Openii en una publicación en diámetro.

“La capacidad de usar las mismas interfaces y herramientas con las que los humanos interactúan a diario amplían la utilidad de la IA, ayudando a las personas a evitar tiempo en las tareas cotidianas mientras abren nuevas oportunidades de compromiso para las empresas”.

Un “agente” de IA, la última tendencia de Silicon Valley, es un ayudante digital que se supone que detecta un entorno, toma decisiones y toma medidas para conquistar objetivos específicos.

Google en diciembre anunció capacidades de agente con el emanación de Gemini 2.0, su maniquí de inteligencia sintético más reformador hasta la término.

AI Race Rival Anthrope Dos meses ayer agregó una función de “uso de la computadora” a su maniquí Claude Frontier AI en una período beta pública empírico.

“Los desarrolladores pueden dirigir a Claude a usar las computadoras como lo hacen las personas, mirando una pantalla, mover un cursor, hacer clic en recadero y escribir texto”, dijo Anthrope en una publicación en ese momento, advirtiendo que era un trabajo en progreso.

Operai describió al cámara como uno de sus primeros agentes de IA capaces de trabajar para las personas de forma independiente, diseñada para completar las tareas que se les da.

El cámara está arreglado solo para los usuarios de nosotros que pagan suscripciones profesionales al servicio Operai “para respaldar un despliegue seguro e iterativo”, dijo Openai.

“Si encuentra desafíos o comete errores, el cámara puede beneficiarse sus capacidades de razonamiento para autocorregir”, dijo Openii.

“Cuando se atasca y necesita ayuda, simplemente le devuelve el control al afortunado”.

El cámara está capacitado para pedirle al afortunado que se haga cargo de las tareas que requieren inicio de sesión, detalles de plazo o al resolver desafíos de seguridad “Captcha” destinados a distinguir entre personas y software en diámetro, según OpenAI.

“Los usuarios pueden hacer que el cámara ejecute múltiples tareas simultáneamente creando nuevas conversaciones, como ordenar una taza de esmalte personalizada en Etsy mientras reserva un campamento en Hipcamp”, dijo OpenAi.

GC/BS