Πιστή στην υπόσχεσή της, η xAI του Elon Musk μόλις παρουσίασε και επίσημα το νέο της προηγμένο μοντέλο τεχνητής νοημοσύνης Grok 3, το οποίο είναι πράγματι το ισχυρότερο στον κόσμο σύμφωνα με τα επίσημα benchmarks και τις πρώτες δοκιμές πραγματικών χρηστών.
Περνώντας σε λεπτομέρειες, μια αρχική έκδοση του Grok 3 κατάφερε να κατακτήσει το θρόνο στην ‘Αρένα’ των AI μοντέλων, όντας η πρώτη AI στην ιστορία που ξεπερνά το όριο των 1400 πόντων. Το μοντέλο της xAΙ κατάφερε να κατακτήσει την πρώτη θέση σε όλες τις κατηγορίες, όντας δραματικά καλύτερο στην συγγραφή κώδικα, σημαντικά ανώτερο στα μαθηματικά, καλύτερο στο να ακολουθεί οδηγίες, στο να γράφει δημιουργικά, στο να διαχειρίζεται μεγάλα μηνύματα, κ.α. Αυτό σημαίνει ότι ξεπέρασε κάθε άλλο μοντέλο που υπάρχει στην αγορά, όπως το GPT-4o, το o1 και το o3 της OpenAI, το Gemini 2.0 της Google, τα R1 και V3 της DeepSeek και το Sonnet 3.5 της Claude.
Here you can see @xai Grok-3’s performance across all the top categories:
— lmarena.ai (formerly lmsys.org) (@lmarena_ai) February 18, 2025
🔹 Overall w/ Style Control
🔹 Hard Prompts & Hard Prompt w/ Style Control
🔹 Coding
🔹 Math
🔹 Creative Writing
🔹 Instruction Following
🔹 Longer Query
🔹 Multi-Turn pic.twitter.com/yOu3nx6VET
Πέρα από τα εντυπωσιακά benchmarks, κατά τη διάρκεια της παρουσίασης έγινε γνωστό ότι το Grok 3 θα φέρει στο προσκήνιο και δύο νέες λειτουργείες, το ‘DeepSearch’ και το ‘Think’. Το DeepSearch θα επιτρέπει στο μοντέλο να ψάχνει σε όλες τις δημοσιεύσεις στο κοινωνικό δίκτυο X και στο internet γενικότερα, για οτιδήποτε του ζητάει ο χρήστης, προσφέροντας άμεσα έγκυρες και επικαιροποιημένες απαντήσεις. Το Think, όπως προδίδει και το όνομά του, θα επιτρέπει στο Grok 3 να λειτουργεί ως reasoning μοντέλο. Αυτό σημαίνει δηλαδή πως θα έχει έναν εσωτερικό διάλογο για να σκέφτεται πριν απαντήσει σε πιο σύνθετα ερωτήματα, κάτι που θα βελτιώνει ακόμη περισσότερο τις επιδόσεις του.
Σύμφωνα με τους Unboxholics. το Grok 3 είναι διαθέσιμο για τους συνδρομητές του Premium+ στο X και σύντομα θα καταφθάσει για όλα τα Premium μέλη της πλατφόρμα. Η ομάδα υποσχέθηκε πως σκοπεύει να κυκλοφορεί ενημερώσεις σχεδόν σε καθημερινή βάση, με το Voice mode για παράδειγμα να καταφθάνει την επόμενη εβδομάδα. Καθοδόν είναι και άλλες προσθήκες, όπως οι προσωπικότητες και τα bookmarks.
Στο άμεσο μέλλον η xAI θα δώσει στη δημοσιότητα και όλο τον πηγαίο κώδικα και τα weights του Grok 2, μιας και το μοντέλο προηγούμενης γενιάς θα γίνει open source, όπως είχε υποσχεθεί η εταιρεία.
Grok-3 is the first model *ever* to score over 1400 on Chatbot Arena and outperforms the best publicly available reasoning models from OpenAI and Google.
— Gavin Baker (@GavinSBaker) February 18, 2025
xAI was founded 13 years after Deepmind and 8 years after OpenAI and is now ahead of both. The “SR-71 Blackbird” of AI labs. pic.twitter.com/ExcdENPu4U
All you need to know to understand which company will win a technology competition is look at the first and second derivatives of the rate of innovation https://t.co/rImcrpzfeY
— Elon Musk (@elonmusk) February 18, 2025
xAI’s Mind Blowing Grok 3 Demo (FULL REPLAY)
— stevenmarkryan (@stevenmarkryan) February 18, 2025
✅ Silences removed to save you time
✅ Louder sound for easier listening
Spoiler: Grok 3 is NUTS!!
Timestamps:
0:00 xAI’s Mind Blowing Grok 3 DEMO
32:13 Grok 3 Q&A
42:01 Grok 3 Voice Mode Preview pic.twitter.com/A2bsvthwG4