רשת עצבים יציבה אודיו חדשה מייצרת מוזיקה המבוססת על תיאור טקסט
Miscellanea / / September 14, 2023
מהיוצרים של Stable Diffusion.
יציבות AI, הידועה בעיקר ברשתות עצביות ליצירת תמונות (דיפוזיה יציבה, שרבוט יציב ולא רק), מְשׁוּחרָר רשת עצבית חדשה Stable Audio. כפי שהשם מרמז, הוא מייצר קטעי אודיו.
הכל עובד בדיוק כמו מחוללי תמונות המבוססים על תיאורי טקסט. המשתמש מציין מילות מפתח (לדוגמה, "היפ-הופ מלודי, מלודי, 85 BPM" או "דת' מטאל עם ריפי גיטרה חזקים ותופים מהירים"), משך הזמן הרצוי ומחכה לתוצאה.
השתמשנו באותו מודל כמו ב-Stable Diffusion כבסיס, אבל אימנו אותו על יצירות מוזיקליות במקום דימויים. בסך הכל הזינו אותה בכ-800 אלף רצועות מאתר המוזיקה המניות AudioSparx - או כ-19,500 שעות של צלילים שונים.
היוצרים מציינים כי המאפיין העיקרי של Stable Audio הוא היכולת ליצור קומפוזיציות באורך נתון. בעבר, רשתות עצביות עבדו רק עם משך זמן קבוע: אם הם היו מאומנים על קטעי אודיו של 30 שניות, הם יכלו ליצור רק קומפוזיציות של 30 שניות. כדי להיות מסוגל להתאים את משך המסלול, המפתחים היו צריכים לשנות את המודל ולהוסיף מטא נתונים לתחילת ולסיום של ההרכב.
Stable Audio מוצע בשלושה דגמים. הגרסה החינמית מאפשרת ליצור לא יותר מ-20 שירים שנמשכים עד 45 שניות בחודש. יש גם מנוי מקצועי המאפשר לך ליצור עד 500 רצועות באורך של עד 90 שניות תמורת $12 לכל חודש (≈1,200 רובל) ואפשרות Enterprise עבור חברות עם יכולת לבחור את נפח הייצור והמחיר בנפרד בסדר. אינך יכול להשתמש במוזיקה שנוצרה למטרות מסחריות ללא מנוי בתשלום.
כמו ברשתות נוירונים דומות אחרות, Stable Audio מכוון יותר ליוצרי תוכן מאשר למוזיקאים מקצועיים. כלים כאלה מתאימים ליצירה מהירה של מוזיקת רקע לפודקאסטים וסרטונים כאשר אין לך זמן או תקציב לשתף פעולה עם מלחין. זה יכול גם להחליף צלילי מלאי אם אתה רוצה צחוק ייחודי או רעשי קהל.
אתה יכול לנסות אודיו יציב באתר הרשמי. יהיה עליך להירשם או להתחבר עם חשבון Google. בהתחלה, ייתכנו הפרעות בגישה עקב העומס הרב על השרת.
אודיו יציב →
עוד רשתות עצביות חדשות🦾✨
- העוזר הוירטואלי של AIDA מסבר יאבחן חולים במרפאות מוסקבה
- האפליקציה החדשה Artisse מייצרת תמונות מגניבות עם הפנים של המשתמש
- Stability AI הציגה את הצ'טבוט Stable Chat - אנלוגי חינמי של ChatGPT