Η εμφάνιση της DeepSeek, της ανερχόμενης κινεζικής εταιρείας τεχνητής νοημοσύνης, έχει προκαλέσει αναστάτωση στον παγκόσμιο χώρο της AI. Ιδιαίτερο ενδιαφέρον προκάλεσε η αποκάλυψη ότι η OpenAI δαπάνησε μόλις 294.000 δολάρια για την εκπαίδευση του μοντέλου R1 της DeepSeek, ένα ποσό πολύ χαμηλότερο σε σχέση με τις δαπάνες των αμερικανικών κολοσσών.

Η ανακοίνωση αυτή ήρθε σε μια περίοδο έντονου διεθνούς ανταγωνισμού, με την Κίνα να διεκδικεί πρωταγωνιστικό ρόλο στην τεχνητή νοημοσύνη. Η DeepSeek παρουσίασε τον Ιανουάριο το σχέδιό της για την ανάπτυξη οικονομικών και ταυτόχρονα ισχυρών μοντέλων, προκαλώντας πτώση στις μετοχές μεγάλων τεχνολογικών εταιρειών, καθώς οι επενδυτές φοβούνται ότι η εταιρεία μπορεί να απειλήσει την κυριαρχία της Nvidia και άλλων ηγετών του χώρου.

Εκπαίδευση μοντέλων με φθηνά τσιπ

Σύμφωνα με το Nature, η DeepSeek χρησιμοποίησε 512 τσιπ Nvidia H800 για την εκπαίδευση του R1, τσιπ ειδικά σχεδιασμένα για την κινεζική αγορά λόγω της απαγόρευσης εξαγωγών ισχυρότερων τσιπ, όπως τα H100 και A100, από τις ΗΠΑ. Το κόστος εκπαίδευσης περιλαμβάνει την λειτουργία ισχυρών υπολογιστικών συστημάτων για εβδομάδες ή μήνες, επεξεργάζοντας τεράστιες ποσότητες δεδομένων.

Η DeepSeek δέχθηκε κριτική από αμερικανικές εταιρείες για τα στοιχεία σχετικά με τις δαπάνες και την τεχνολογία που χρησιμοποίησε. Η Nvidia διαβεβαίωσε ότι τα τσιπ που χρησιμοποιήθηκαν είναι τα H800 και αποκτήθηκαν νόμιμα, ενώ η DeepSeek παραδέχθηκε για πρώτη φορά ότι χρησιμοποίησε τσιπ A100 στα προπαρασκευαστικά στάδια του μοντέλου.

Το κύριο στάδιο εκπαίδευσης του R1 ολοκληρώθηκε σε 80 ώρες, αξιοποιώντας όλα τα 512 τσιπ H800. Η εταιρεία υπερασπίστηκε επίσης τη μέθοδο διαστρωμάτωσης των μοντέλων, υποστηρίζοντας ότι επιτρέπει καλύτερη απόδοση με πολύ χαμηλότερο κόστος εκπαίδευσης και λειτουργίας. Αυτή η τεχνική καθιστά την τεχνητή νοημοσύνη πιο προσιτή για μεγαλύτερο κοινό, μειώνοντας τις απαιτήσεις σε ενέργεια και υπολογιστική ισχύ που απαιτούν τα προηγμένα μοντέλα.

Η DeepSeek φαίνεται να αλλάζει τους κανόνες του παιχνιδιού, φέρνοντας νέα δεδομένα στον διεθνή ανταγωνισμό AI και προκαλώντας αμφισβητήσεις για τον ρόλο της Κίνας στην τεχνητή νοημοσύνη.

Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

    Αφήστε μια απάντηση