Η Google εντείνει τον ανταγωνισμό στους «πολέμους των AI agents» στα προγράμματα περιήγησης.
Η εταιρεία λανσάρει ένα πακέτο νέων λειτουργιών που ενσωματώνουν βαθύτερα το Gemini στον Chrome. Αυτό ξεκινά με την ανακοίνωση ότι το Gemini στον Chrome δεν θα απαιτεί πλέον συνδρομή και θα αρχίσει να διατίθεται σε χρήστες Mac και Windows στις ΗΠΑ από σήμερα. Όλα αυτά εντάσσονται στη μάχη για την κυριαρχία των AI browser agents, στην οποία συμμετέχουν οι OpenAI, Anthropic, Google, Perplexity και άλλοι.
Όπως ο agent του ChatGPT της OpenAI, έτσι και η Google σκοπεύει να εισαγάγει μια δυνατότητα στο Gemini που θα του επιτρέπει να εκτελεί «βαρετές εργασίες» για λογαριασμό σου τους επόμενους μήνες, σύμφωνα με τη Charmaine D’Silva, διευθύντρια διαχείρισης προϊόντος του Chrome. Το εργαλείο αυτό σχεδιάζεται για να κάνει πράγματα όπως:
- αγορές παντοπωλείου από λίστα που βρίσκεται στο email σου,
- επαναπρογραμματισμός παραδόσεων,
- κλείσιμο ραντεβού για κομμωτήριο,
- κρατήσεις σε εστιατόρια και άλλα.
Θα υπάρχουν σημεία επιβεβαίωσης για οποιαδήποτε ενέργεια θεωρείται «υψηλού κινδύνου» ή «μη αναστρέψιμη». Η Google δεν έδωσε συγκεκριμένη ημερομηνία κυκλοφορίας στο The Verge.
Πρόσβαση σε Workspace και άλλες υπηρεσίες της Google
Κάποιες λειτουργίες έρχονται νωρίτερα. Οι νέες δυνατότητες που ανακοίνωσε η Google την Πέμπτη περιλαμβάνουν την πρόσβαση του Gemini στον Chrome στο Google Workspace, για χρήστες τόσο της κανονικής όσο και της επαγγελματικής έκδοσης, με το λανσάρισμα να ξεκινά από σήμερα. Επίσης ενεργοποιούνται ενσωματώσεις με άλλα προϊόντα της Google, όπως το Ημερολόγιο, το YouTube, οι Χάρτες και άλλα.
Αυτό επιτρέπει στο Gemini στον Chrome να «βρίσκει σχετικές πληροφορίες στην οθόνη σου και να αναλαμβάνει δράση πάνω σε αυτές», είπε η D’Silva.
«Οι επιχειρήσεις είναι ένας αρκετά σημαντικός τομέας εστίασης για τον Chrome γενικά», πρόσθεσε.
Χρήση του Gemini στις καρτέλες σου
Στον Chrome για υπολογιστές, οι χρήστες μπορούν πλέον να χρησιμοποιούν τον agent του Gemini σε πολλές καρτέλες για να:
- συγκρίνουν προϊόντα,
- συνοψίζουν πληροφορίες από πολλές πηγές,
- ανακαλούν σελίδες από το ιστορικό του προγράμματος περιήγησης.
Αυτό σημαίνει ότι από σήμερα, οι χρήστες μπορούν να κλείνουν τις πολλές ανοιχτές καρτέλες τους, και μετά να ζητούν από τον agent να τις ξαναβρεί.
Περισσότερα στο κινητό
Σε Android, το Gemini είχε ήδη ενσωματωθεί, αλλά πλέον οι χρήστες μπορούν να μοιράζονται ολόκληρο το περιεχόμενο μιας σελίδας, όχι μόνο αυτό που φαίνεται στην οθόνη τους, ώστε να μπορούν να κάνουν πιο «βαθιές ερωτήσεις», σύμφωνα με την D’Silva.
Οι χρήστες iPhone θα αποκτήσουν σύντομα πρόσβαση στο Gemini μέσω της εφαρμογής Chrome.
Ανταγωνισμός και με άλλα AI agents
Οι βελτιώσεις στους AI agents των προγραμμάτων περιήγησης έχουν ξεκινήσει εδώ και καιρό:
- Η Anthropic παρουσίασε πέρυσι το Computer Use, επιτρέποντας στον Claude να χρησιμοποιεί το browser σου για να ολοκληρώνει εργασίες.
- Η OpenAI παρουσίασε το Operator και τον Ιούλιο το ενοποίησε με τα Deep research εργαλεία, δημιουργώντας τον ChatGPT Agent.
- Τον ίδιο μήνα, η Perplexity λάνσαρε το δικό της browser με AI, το Comet.
- Η Atlassian εξαγόρασε την The Browser Company (δημιουργούς του Dia) για 610 εκατ. δολάρια.
Με τη νέα επέκταση του Gemini στον Chrome, η Google βάζει σοβαρή υποψηφιότητα για την επόμενη γενιά AI browsers – όπου ο browser δεν είναι πια απλώς εργαλείο πλοήγησης, αλλά βοηθός που «κάνει πράγματα» για εσένα.