אספו רשימת השמעה, מצאו רצועה תקועה בראשכם, כתבו מחזה: מה יכולה בינה מלאכותית לעשות עם מוזיקה
Miscellanea / / March 30, 2022
זיהוי קומפוזיציות
מסלול מגניב נשמע בכל מקום: במרכז קניות, בבית קפה ואפילו מחלון רכב סמוך, בעמידה בפקק. כדי לא לפספס את השיר הלא מוכר שאתה אוהב, מספיק להפעיל את אפליקציית הזיהוי. שם הקומפוזיציה ושם האמן שבהם נמסרים על ידי בינה מלאכותית תוך שניות. נכון, מאחורי תוצאה כה מהירה יש הכנה יסודית: כדי ללמוד במהירות את המנגינה, התוכנית צריכה קודם כל לזכור אותה. לשם כך, רשתות עצביות מוצגות לספרייה ענקית של רצועות, ואז אלגוריתמים ממירים את הצליל לספקטרוגרמה ומפרקים אותו לזמן, תדר ועוצמה.
אנטולי סטארוסטין
ראש שירות פיתוח טכנולוגי ב-Yandex Media Services.
ספקטרוגרמה היא גרף. הזמן ממוקם לאורך הציר האופקי, תדר הקול ממוקם לאורך הציר האנכי, ועוצמתו ברגע קבוע מתבטאת בצבע. אות נמוך מיוצג על ידי פס אדום בתחתית, ואות גבוה בחלק העליון. התוצאה היא תמונה המורכבת מפסים אופקיים צבעוניים. הניתוח של מעגלים כאלה עוזר לזהות מוזיקה. כאשר עובדים עם ספקטרוגרמות, משתמשים באותן גישות רשת עצביות כמו בניתוח תמונה.
נניח שאדם שומע שיר ברדיו ורוצה לדעת את השם והאמן. תוכנית הזיהוי בונה ספקטרוגרמה של הקטע הנשמע ושולחת אותו לספריית הרצועות שלה. אחר כך הוא משווה את ה"תמונה" של המנגינה הרצויה עם הספקטרוגרמות של יצירות אחרות ובוחר את ההתאמה המדויקת ביותר. יחד עם זאת, בינה מלאכותית מזהה את המנגינה גם באמצעות הפרעות חמורות, כמו רעשי כביש או תיקונים בדירה שכנה.
אגב, הרשת העצבית מסוגלת לא רק לזהות את האמן ואת שם הרצועה שתקוע בראש, אלא גם לקבוע בערך את הז'אנר שלה. לשם כך מלמדים את הבינה המלאכותית למצוא תבניות בסגנונות מוזיקליים שונים. מאפיינים ספציפיים כאלה בדרך כלל אינם נגישים לראייה ולשמיעה של האדם. אבל בזכות למידת מכונה, אפשר לחשב ז'אנרים מוזיקליים מתמונות ספקטרוגרמה.
ממליץ על שירים
נראה שלמצוא "אותו" רצועה שתתאים למצב הרוח שלך במיליארדי שירים בעצמך, זה כמעט לא סביר כמו להתאהב ממבט ראשון. אבל הודות לאלגוריתמי המלצות, התאמות מושלמות לא מתרחשות כל כך הרבה. ראשית, הבינה המלאכותית מחפשת אנשים בעלי טעם דומה, ולאחר מכן מתחברות נוסחאות סטטיסטיות: מספר הלייקים, הדיסלייקים, ההשמעות והדילוגים של הרכב מסוים.
אנטולי סטארוסטין
המלצת שירים עובדת לפי סכמה פשוטה: אם Vasya אהב את רצועה X, ואז גם Petya דירג אותה, אז כאשר Vasya אוהב Y, Petya גם צריך להמליץ על טראק Y. כאשר האלגוריתם צריך למצוא את השיר הבא, הנוסחה מיושמת על קבוצה של שירים פוטנציאליים. המתאים ביותר צפים למעלה.
תוכן "קר", שלא נראה ברשימות ההשמעה של המאזין ההמוני, מתפשט לאט יותר. אבל הודות לרשתות עצביות, לאמנים לא ידועים ולמוזיקה נישה יש עדיין סיכוי קטן להבהב בזרם ההמלצות. אם נפשט את כל הניואנסים הטכניים, אז נוכל לומר שבמקרים כאלה, בינה מלאכותית מגלה באיזו תדירות משתמש ספציפי מאזין לשירים עם ספקטרוגרמות דומות, ומזמין אותו מדי פעם להכיר שירים חדשים מסלולים.
מרי גו
זמרת.
לפעמים אני מחפש השראה בהמלצות. את בחירת ההרכב אני מפקיד בידי שירות המוזיקה, מאזין ללחנים, מוצא צלילים או טקסטים מעניינים. אז אתה באמת יכול להתאהב באופן ספונטני ברצועה של אמן לא ידוע. ושורה נוספת ששמעתי בטעות יכולה לעורר אותי ליצור את השירים שלי.
רשתות עצביות גם עוזרות ליצור בחירות מוזיקה לכושר, הליכה או שינה. עורכי תוכן בוחרים מסלולי התייחסות לאלגוריתמים, ועל סמך הספקטרוגרמות שלהם, בינה מלאכותית מרחיבה המלצות נושאיות.
ליצור מוזיקה
בעבר, רק מלחינים יכלו ליצור מנגינות. עכשיו זה אפשרי ללא השתתפות של מוזיקאים. בשנת 2020, הולנד אירחה את תחרות האירוויזיון הראשונה לרשתות עצביות - תחרות השירים של AI. האוסטרלי ניצח שיתוף פעולה בינה מלאכותית עם קואלות, שלדגים ושדים טסמניים. השיר הוקדש לשריפות היער המשתוללות ביבשת. קולות בעלי חיים הוקלטו בדגימות קצרות - קטעים באורך 1-2 שניות. האלגוריתם שילב אותם עם הלהיטים של כל הזוכים הקודמים באירוויזיון האמיתי, ולאחר מכן הם הרכיבו את הסמפלים למנגינה משלהם.
זו לא הדוגמה היחידה לאיחוד יצירתי מוצלח של מתכנתים ורשתות עצביות. בשנת 2019, עם סיום פסטיבל החורף הבינלאומי לאמנויות בסוצ'י, הופיעה התזמורת הממלכתית יצירה בת 8 דקות. הוא נכתב על ידי המלחין קוזמה בודרוב מקטעים נפרדים של מנגינות שנוצרו על ידי רשתות עצביות. כיום, יצירת מוזיקה היא התחום המבטיח ביותר לפיתוח בינה מלאכותית.
אנטולי סטארוסטין
בינה מלאכותית יכולה ליצור מוזיקה בשלוש דרכים. הראשון קשור לבניית "לבנים" מוכנות של סאונד - דגימות. במקרה זה, האלגוריתם פשוט מסדר אותם בסדר הנכון על פני מספר רצועות שמע, והמעבד האלקטרוני מערבב את הרצועה המוגמרת. הדרך השנייה היא ליצור תווי מוזיקה. זה כמו לכתוב הוראות למוזיקאי לנגן עליו את העבודה המוגמרת. והדרך השלישית היא להקליט את אות האודיו ה"גולמי". במקרה זה, הרשת העצבית עצמה יוצרת גלי קול הדומים, למשל, למוצרט או לביטלס.
אגב, גם רשתות נוירונים יכולות לכתוב שירה לשירים. עד כה, שירים כאלה נשמעים מוזרים למדי, אז כותבי שירים לא צריכים לדאוג לגבי אבטלה. בנוסף, "מוח המחשב" חף מרגשות. הוא אינו יכול לחדור לתוך ההקשר הרגשי ולהעביר את החוויות שאילצו את מחברי היצירות ליצור.
מרי גו
שירה ומוזיקה עוסקות בעיקר בנפש, בעולם הפנימי, בחוויות, ברגשות וברגשות של אנשים. למשל, הרצועה החדשה "אל תישרף" היא הסיפור האישי שלי, אבל הוא גם על כל מי שהולך אחרי חלום ומנסה להבין את עצמו. אני לא חושב שבינה מלאכותית תחליף אי פעם אדם חי בתעשיית המוזיקה. אבל כאן אתה יכול לקבל טנדם מעניין "אנושי - רשת עצבית". אנחנו כבר מכירים עשרות דוגמאות כאשר בינה מלאכותית עזרה למלחינים ליצור מנגינות ייחודיות. למעשה, זהו כיוון חדש בעולם המוזיקה, אשר, אני בטוח, יהיה לו מאזין וקהל משלו בעתיד.
בינה מלאכותית מנגישה את היצירתיות לכולם, והמוזיקה עוזרת לה להתפתח. כדי להבין כיצד שני הקטבים הללו מתכנסים ומשפיעים זה על זה, אתה יכול "מספרי שיעור" מ- Yandex - "אמנות דיגיטלית: מוזיקה ו-IT". יחד עם גיבורי הקומיקס ילמדו המשתתפים כיצד רשתות עצביות מזהות ומייצרות רצועות ואילו טכנולוגיות מסייעות בעבודת שירותי המוזיקה המוכרים לנו. בשיעור ינסו התלמידים לנחש את המנגינה באמצעות הספקטרוגרם בעצמם וירכיבו רשימת השמעה עם המלצות.
אני רוצה "מספרי שיעור"
כיסוי: וויליאם ברדברי / Shutterstock / אריק איסלי / Shutterstock / Ljupco Smokovski / Shutterstock / FOTOSPLASH / Shutterstock / אולגה סלפינה / Lifehacker