0
צפיות
אם רציתם לצפות בשוטר סערה אימפריאלי שואב אבק במעלה החוף.
חברת NVIDIA הכריז מודל VideoLDM AI חדש שיוצר סרטונים קצרים המבוססים על טקסט. הוא פותח בשיתוף פעולה עם חוקרים מאוניברסיטת קורנל.
VideoLDM לוקח בחשבון עד 4.1 מיליארד פרמטרים, 2.7 מיליארד מהם מאומנים בווידאו. קליפים שנוצרו יכולים להיות עד 2048×1280 פיקסלים ב-24 פריימים ומשך זמן של עד 4.7 שניות.
הרשת העצבית מסוגלת ליצור גם סצנות פשוטות עם כמה מילים בבקשה וגם משהו מורכב יותר. כמה דוגמאות:
דוגמאות נוספות מוצגות אתר הפרויקט.
רשת נוירונים זו של NVIDIA עדיין אינה ברשות הציבור. הוא הוצג כמאמר מחקר במסגרת הכנס לראיית מכונה וזיהוי דפוסים.
המפתחים ציינו התקדמות מרשימה ומהירה בלמידה, אך לא דיברו על העתיד האפשרי של הרשת העצבית. עם זאת, אנו יכולים להניח שבקרוב נקבל אנלוגי וידאו מלא אמצע מסע.
קרא גם🧐