Un guide complet des applications de musique AI en 2023 (toutes catégories)
Un guide complet des applications de musique AI en 2023 (toutes catégories)
Au cours des trois dernières années, les applications musicales d'IA ont surgi partout. C'est une période passionnante pour ceux d'entre nous qui aiment bricoler avec les technologies émergentes. Si vous suivez de près l'intelligence artificielle, vous avez probablement vu les publications virales sur les réseaux sociaux qui répertorient les derniers logiciels d'IA que vous devez essayer .
Beaucoup de ces agrégateurs incluent des applications audio et musicales, mais ils ont tendance à se concentrer sur les générateurs de boucles d'IA et l'usurpation de voix de célébrités. Dans certains cas, ils citeront des outils qui ne fonctionnent plus, mais les présenteront comme s'ils étaient neufs.
Notre objectif ici sur le blog AudioCipher est de donner une voix aux petits outils de musique IA que le public ignore en grande partie. Il y aura inévitablement des outils qui ne figureront pas sur la liste, soit parce que nous les avons négligés, soit parce que nous avons estimé qu'ils n'atteignaient pas un certain seuil de qualité pour mériter d'être mentionnés.
Nous commencerons par certains des outils d'entrée de gamme familiers que tout le monde peut utiliser, avant de nous aventurer dans des logiciels qui plaisent principalement aux musiciens.
Table des matières : Catégories d'applications musicales AI
Les premières conversations techniques sur l'intelligence artificielle et la musique remontent souvent à une conférence sur la musique informatique en 1974 à la Michigan State University. Pour ceux qui veulent explorer l'histoire de ce domaine, le journaliste et expert en apprentissage automatique Dolby Jordi Pons a rédigé un solide résumé de l'histoire de la musique de l'IA .
Notre liste d'applications de musique AI ci-dessous a été testée et s'est avérée active en mai 2023. Vous pouvez cliquer sur les titres de section ou les noms de logiciels individuels pour accéder à cette partie de la page.
Section 1 : Applications musicales IA pour débutants et non-musiciens
Section 2 : Logiciel Text to Music AI
Section 3 : DAW IA pour les musiciens
Section 4 : Convertisseurs audio-midi AI
Section 5 : Catégories d'applications musicales AI supplémentaires
Applications musicales IA pour débutants et non-musiciens
Pour commencer, nous partagerons une liste complète des applications de musique AI les plus populaires que tout le monde peut utiliser pour créer une boucle ou une chanson propre. Par propre, je veux dire qu'il manque les artefacts audio étranges que vous entendrez des logiciels de synthèse audio neuronale comme les modèles Dance Diffusion d'Harmonai.
SOUNDRAW.io
Site Web : SOUNDRAW
Popularité : élevée
Niveau de difficulté : Faible
Attributs Génératifs : Ambiance, genre, thème, durée, tempo, instruments
Genres musicaux : Acoustique, Hip Hop, Beats, Funk, Pop, Drum n Bass, Trap, Tokyo night pop, Rock, Latin, House, Tropical House, Ambient, Orchestra, Electro & Dance, Electronica, Techno & Trance, RnB & Soul , Lofi Hip Hop
Coût : 19,99 $/mois ou 203,88 $/an
Les utilisateurs peuvent explorer les pistes existantes dans la base de données musicale SOUNDRAW ou cliquer sur créer pour commencer à générer de la musique à partir des attributs disponibles tels que l'ambiance, le genre et le thème.
À partir de la mi-2023, le hashtag #aimusic sur Twitter et TikTok présente les chansons créées par Soundraw plus en évidence que les autres concurrents de l'application de musique AI.
Une application musicale AI simplifiée, appelée Ecrett , s'identifie comme le "petit frère" de Soundraw et prétend avoir généré plus de 54 millions de combinaisons de musique.
Communauté musicale Boomy AI
Site internet : Boomy
Popularité : élevée
Niveau de difficulté : Faible
Genres musicaux : Electro, Rap beats, Lofi, Global Groove, Relaxing Meditation, Experimental
Attributs génératifs : Genre, Instruments, Batterie, Mixage, Effets sonores, Tempo
Coût : Trois forfaits disponibles
Plan gratuit : sauvegardes limitées (quantité non divulguée) et 5 albums/singles
Premium : (2,99 $/mois) Sauvegardes, téléchargements illimités, 20 versions
Pro : (9,99 $/mois) Chansons, sorties et demandes de droits prioritaires illimitées
Boomy est une communauté de génération de musique IA qui permet aux utilisateurs de créer du matériel original et de percevoir des redevances via des plateformes de streaming. L'application Web offre une barrière à l'entrée extrêmement faible, avec seulement quelques clics nécessaires pour créer une chanson.
Plus de 14,5 millions de chansons ont été créées avec Boomy, ce qui représente 14 % du total de la musique enregistrée dans le monde. L'application a été critiquée début mai 2023 lorsque Spotify a accusé les créateurs de Boomy de spammer le service avec des fermes mobiles qui augmentent le nombre de diffusions en continu.
Des dizaines de milliers de chansons ont été supprimées et de nombreux sites ont signalé à tort que ces suppressions étaient dues à la mauvaise qualité de la musique de Boomy. Spotify a clarifié sa position sur les fermes de flux et a rétabli le pipeline de publication Boomy une semaine plus tard.
Création musicale IA sonore
Site Web : Soundful
Popularité : moyenne
Niveau de difficulté : Faible
Genres musicaux : Lofi hiphop, Hype beats, Relaxation, Club beats, Trap, Dance, Drill, Afro pop, Disco, Pop funk, Synth pop, EDM, Techno, RnB, Latin, Reggaeton
Attributs génératifs : Genre, Instruments, Batterie, Mixage, Effets sonores, Tempo
Coût : Trois forfaits disponibles
Plan gratuit : 10 téléchargements, 1 pack de tiges
Premium : (9,99 $/mois ou 89 $/an) Téléchargements illimités, 5 packs de tiges
Pour : Le coût n'est pas divulgué, solution personnalisée, monétisez votre musique Soundful
Soundful est plus nuancé que Boomy dans son approche de la génération musicale. Vous pouvez choisir parmi un plus grand nombre de genres et d'attributs musicaux.
Au cours de mes expériences avec Soundful, un battement "sombre" dans une tonalité majeure produisait une piste dans la tonalité mineure relative. Cela pourrait amener les débutants à croire qu'une chanson est en "do majeur" alors qu'elle est en fait en "la mineur". C'est un peu réducteur de penser qu'une chanson sombre doit être dans une tonalité mineure. La chanson Splash Warning de Meek Mill présente une mélodie pentatonique majeure avec un pad obsédant en dessous, par exemple.
Collection Amper AI Music de Shutterstock
Amper était une autre puissante application de générateur de musique basée sur un navigateur. Il a fourni un ensemble de fonctionnalités similaire à AIVA, mais avec plus de contrôles sur la sortie finale. Pour le meilleur ou pour le pire, Shutterstock a acquis Amper en 2020 et a assimilé la sortie musicale de l'application dans une bibliothèque musicale statique. En conséquence, l'application de musique AI a été réduite à un service audio stocké en concurrence avec d'autres sites de musique libre de droits comme AudioJungle , Envato Music , Epidemic Sound et Artlist .
MuseNet MIDI Generator
MuseNet était une application gratuite basée sur un navigateur d'OpenAI qui générait des fichiers MIDI à l'aide de l'intelligence artificielle. Lors de son lancement en 2019, les utilisateurs pouvaient choisir parmi quelques paramètres tels que le style, les instruments et la longueur. Le MIDI serait lu dans votre navigateur et il y avait une option pour exporter le fichier MIDI gratuitement.
Un développeur indépendant, Steven Waterman, a créé une couche d'interface utilisateur au-dessus de l'API MuseNet appelée MuseTree . Sa conception était basée sur des nœuds de branchement qui permettaient aux utilisateurs de créer rapidement des variantes et avec plus de contrôles que le site Web MuseNet.
Malheureusement, OpenAI a désactivé l'API MuseNet vers la fin décembre 2022, la même semaine que ChatGPT est sorti. La page Musenet propose désormais une démo statique qui imite la fonctionnalité de génération MIDI. Il génère toujours la même sortie MIDI. MuseTree ne fonctionne plus, car l'API MuseNet a été mise hors service.
Logiciel de synthèse musicale
Les applications de conversion de texte en image telles que Dalle 2 et Midjourney ont créé une demande pour des expériences similaires dans la génération de musique et de vidéo. À partir de 2023, il existe une poignée d'applications musicales IA qui offrent cette capacité, avec plus ou moins de succès.
AudioCipher : texte vers MIDI VST
Site Web : AudioCipher
Coût : 29,99 $ achat unique (mises à niveau gratuites à vie)
Format d'application AI Music : formats de plug-in VST/AU, option autonome
Format de sortie musique : Midi
Public cible : Musiciens qui utilisent un DAW
Lorsque nous avons lancé le plug-in AudioCipher text-to-midi en 2020, nous n'avions pas l'intention de devenir une application musicale AI. Nous développions une technique plus simple et classique appelée le cryptogramme musical .
Dans sa forme actuelle, les utilisateurs d'AudioCipher contrôlent la signature de clé, les extensions d'accords et l'automatisation du rythme. Des fonctions de randomisation supplémentaires pour la construction de rythmes et d'accords offrent des variations infinies pour votre texte. Les musiciens conservent toute leur liberté d'action sur les instruments qu'ils choisissent et façonnent ces accords et mélodies en musique. Ce processus créatif pourra ensuite être partagé avec les fans sous forme d' easter egg musical .
À mesure que les API texte-musique de l'IA deviennent plus accessibles, nous explorons la possibilité de mettre à niveau notre algorithme. Les modèles text-to-MIDI existants n'ont pas démontré la qualité et la flexibilité que nous recherchons. Notre équipe produit est actuellement en pourparlers avec plusieurs ingénieurs ML. Nous pourrions finir par former notre propre modèle texte-MIDI si nous en avons les moyens. Les revenus des ventes d'applications ont financé la recherche et le développement continu d'applications pour maintenir cet effort en vie.
La version 4.0 d'AudioCipher devrait sortir à l'automne 2023. Les clients reçoivent des mises à jour gratuites chaque fois qu'une nouvelle version sort.
Application Web Mubert Text-to-audio
Site internet : Mubert
Coût : la structure de licence varie de 19 à 499 $ par piste pour une piste de 45 secondes
Format de l'application AI Music : application Web
Format de sortie de musique : MP3 et Wav
Public cible : Musiciens et non-musiciens
Mubert est actuellement le seul logiciel de synthèse musicale à générer des chansons complètes sans artefacts sonores indésirables. Leur système accepte des descriptions écrites et les transmet à un modèle ML formé sur un ensemble de données audio étiqueté. Les boucles créées par l'homme existantes dans la base de données sont modifiées à l'aide d'algorithmes de composition et d'une couche de conception sonore. Cela confère un avantage distinct aux autres services de synthèse audio tels que Riffusion et l'application MusicLM de Google. Il manque les artefacts sonores indésirables produits lors de la synthèse audio neuronale.
diffusion
Site internet : Riffusion
Coût : Gratuit
Format de l'application AI Music : application Web
Format de sortie de musique : MP3
Public cible : Musiciens et non-musiciens
Riffusion a été publié en décembre 2022, précédant l'application MusicLM de Google de près de six mois. L'application Web gratuite utilise la génération de texte en image de Stable Diffusion pour restituer des spectrogrammes (images de son) à partir de l'entrée de l'utilisateur. Ces spectrogrammes sont ensuite sonifiés (rendus audibles) pour produire de la musique. Il s'agit d'une technique unique qui produit des clips de courte durée et de faible fidélité. L'audio manque de qualité mais compense par son charme et sa valeur de divertissement.
Google MusicLM
Site Web : Google MusicLM
Coût : Gratuit
Format d'application AI Music : cuisine de test AI (application autonome Google)
Format de sortie de musique : fonctionnalité de téléchargement disponible pour certains utilisateurs uniquement
Public cible : Musiciens et non-musiciens
MusicLM fournit le service de génération de texte en chanson le plus précis. Les scientifiques des données de l'équipe de Google ont mesuré la parité de la sortie audio de MusicLM par rapport au texte initial et ont constaté qu'elle surpassait à la fois Riffusion et Mubert. La qualité audio est bien meilleure que Riffusion, mais inférieure à Mubert en raison de la présence de bruit et d'artefacts.
Il y a plusieurs lacunes actuellement. Les utilisateurs ne peuvent pas utiliser d'invites textuelles incluant les noms d'artistes ou leurs chansons. Un mot-clé sur liste noire comme "death" interdit la génération de genres comme le death metal. Les exportations MIDI ne sont pas disponibles. Le téléchargement n'est disponible que pour certains utilisateurs.
Nous avons écrit une introduction aux ensembles de données musicales AI de Google et comment ils ont formé les modèles qui alimentent MusicLM. En tant que propriétaire de YouTube, Google a le droit de s'entraîner sur n'importe quelle vidéo de sa collection. Leurs ensembles de données comprennent une feuille de calcul humaine appelée MusicCaps, une collection de taille moyenne appelée AudioSet et un énorme ensemble de données non supervisé de plus de 40 millions de fichiers appelé MuLan.
Déformation du son
Site Web : WarpSound
Coût : Inconnu
Format de l'application AI Music : API (pour les flux Twitch)
Format de sortie de la musique : audio en streaming sur Twitch
Public cible : Gamers et streamers en direct
WarpSound est une société de génération de musique IA adaptative qui permet aux utilisateurs de créer de la musique et de publier des NFT sur OpenSea. En mai 2023, ils ont annoncé une API à venir qui prendrait en charge la génération de texte en musique GPT-4, parmi plusieurs autres types d'entrées. Ils se spécialisent dans la musique continue qui s'adapte aux invites entrantes. Comme Mubert, leur audio se compose d'une couche de composition AI MIDI et d'une conception sonore pour les instruments.
DAW IA pour les musiciens
La notion de AI DAW est encore relativement nouvelle. WavTool et Audio Design Desk sont nos favoris personnels en raison de leurs améliorations innovantes aux flux de travail existants. AIVA et BandLab sont de simples générateurs de musique AI qui incluent un navigateur-DAW, c'est pourquoi nous les incluons dans cette catégorie.
WavTool GPT-4 DAW
Site Web : WavTool
Coût : 20 $/mois
Format de l'application : application Web
WavTool est le premier AI DAW à proposer un assistant de production musicale GPT-4. Comme le montre la vidéo ci-dessus, les utilisateurs peuvent demander au copilote IA de créer de nouvelles pistes, d'ajouter des effets et même de composer du MIDI. Il excelle dans les instructions prescriptives et se débat avec des déclarations abstraites comme "écrire une bonne chanson" ou "écrire une mélodie entraînante".
Nous avons publié un article de réflexion expliquant comment les invites musicales AutoGPT pourraient améliorer les limitations des méthodes d'appel et de réponse trouvées dans Wavtool ou lors de l'utilisation des invites musicales ChatGPT .
WavTool a ajouté une nouvelle fonction de générateur d'échantillons AI. L'un des membres de notre équipe l'a examiné dans le clip ci-dessous.
Bureau de conception audio
Site Web : Bureau de conception audio
Coût : Trois forfaits disponibles
De base : (8,99 $/mois ou 89 $/an) 8 pistes et 50 régions, 3 000 sons
Personnel : (14,99 $/mois ou 149 $/an) Pistes, régions, 70 000 sons illimités
Professionnel : (29,99 $/mois ou 299 $/an) Options de licence commerciale
Format de l'application : DAW de bureau
Audio Design Desk est une DAW de conception sonore qui utilise l'intelligence sonore pour positionner et échanger à chaud les fichiers audio par rapport à la vidéo. Les utilisateurs peuvent déclencher des classes entières de sons, comme les contremarches et les impacts, d'une simple pression sur une touche. Cela facilite la création de paysages sonores complets pour une scène en une seule prise.
ADD a remporté le prix du produit de l'année et du meilleur du spectacle lors de conventions audio comme le NAMM et le NAB au cours des deux dernières années. La prochaine version d'Audio Design Desk comprendra une suite intégrée d'outils d'intelligence artificielle de leur société sœur, Makr .
Vous pouvez faire une démonstration de l'application directement sur leur page d'accueil ou regarder une présentation en direct de l'un de leurs experts produit ci-dessous.
IL ÉTAIT UN GÉNÉRATEUR DE CHANSONS
Site internet : AIVA
Popularité : moyenne
Niveau de difficulté : faible à moyen
Genres musicaux : Cinématique moderne, Électronique, Pop, Ambient, Rock, Fantastique, Jazz, Sea Shanty, Cinématique du XXe siècle, Tango, Chinois
Attributs Génératifs : Ambiance, genre, thème, durée, tempo, instruments
Coût : Trois forfaits disponibles
Forfait gratuit : comprend 3 téléchargements par mois au format MIDI et MP3
Standard : (15 €/mois ou 132 €/an) inclut 15 téléchargements par mois
Pro : (49 €/mois ou 396 €/an) comprend 300 téléchargements et droits d'auteur
AIVA a été l'une des premières entreprises à résoudre la génération de musique instantanée avec l'IA. Il s'exécute dans votre navigateur Internet, en utilisant des algorithmes d'apprentissage en profondeur formés sur plus de 30 000 compositions humaines sur plusieurs années. Vous n'avez pas besoin de jouer d'un instrument ou de savoir faire de la musique pour l'utiliser. AIVA inclut un éditeur MIDI qui nécessite une plus grande sensibilisation à l'arrangement de la musique numérique.
Bandlab SongStarter
Site Web : Bandlab SongStarter
Popularité : moyenne
Niveau de difficulté : faible à moyen
Genres musicaux : Pop, Trap, Hip Hop, Retro Wave, Pop acoustique, Lo-fi, Électronique, Latin, Ambient, RnB
Attributs génératifs : Genre, tempo, signature de clé, effets
Coût : 14,95 $/mois ou 149,50 $/an
BandLab est un navigateur DAW populaire qui offre un générateur de musique AI d'entrée de gamme. Les utilisateurs sélectionnent un genre, puis choisissent l'une des trois variantes. BandLab rend les tiges de la piste AI disponibles dans leur studio numérique. Ainsi, bien que les attributs génératifs soient limités, les musiciens peuvent apporter des modifications au tempo et à la tonalité après coup. Comme la plupart des DAW, vous pouvez également contrôler le panoramique, le volume et les effets.
Convertisseurs audio-midi IA
Ces applications audio vers midi pourraient être utiles pour les musiciens qui ne peuvent pas ou ne veulent pas déchiffrer les accords ou les mélodies des chansons enregistrées. Les producteurs de musique qui souhaitent appliquer la syntonisation automatique et affiner leurs performances vocales trouveront dans Melodyne l'option la plus utile ici.
Convertisseur audio-MIDI polyphonique Samplab
Site Web : Samplelab
Coût : 9,99 $/mois ou 99,99 $/an
Audio polyphonique pris en charge : oui
Format de l'application : plug-in DAW et autonome
Samplab 2 est actuellement la principale application de musique audio polyphonique vers MIDI AI. Les utilisateurs téléchargent un fichier audio et sélectionnent la région qu'ils souhaitent transcrire. La couche d'intelligence artificielle détecte des instruments distincts et convertit chacun en une piste MIDI distincte. Au cours des six derniers mois, la société a déployé plusieurs mises à jour et améliorations, décrites dans la vidéo ci-dessous.
Présentation de base de Spotify
Site Web : Emplacement de base
Coût : Gratuit
Audio polyphonique pris en charge : oui
Format de l'application : application Web
En tant que l'une des nombreuses applications musicales Spotify AI , Basic Pitch est probablement l'outil créatif le plus pragmatique pour les producteurs de musique. Ce convertisseur audio-midi polyphonique gratuit se charge directement dans votre navigateur.
Basic Pitch ne sépare pas les instruments comme le fait Samplab , et sa précision dépend fortement de la complexité et des niveaux de bruit de la source audio. Vous pouvez prévisualiser la piste MIDI dans le navigateur et télécharger le fichier directement depuis le site si vous souhaitez le conserver. Nous avons eu de meilleurs résultats avec Samplab mais Basic Pitch est une alternative gratuite.
Melodyne 5 de Celemony
Site Web : Melodyne
Coût : 399 $
Audio polyphonique pris en charge : oui (un seul instrument à la fois)
Format de l'application : plugin et options autonomes
Melodyne 5 est généralement considéré comme la référence en matière de conversion et d'édition audio vocale vers MIDI. Le coût élevé a mis ce logiciel hors de portée de votre ingénieur du son moyen, mais les transcriptions sont très précises et l'éditeur de piano roll donne aux utilisateurs un contrôle inégalé sur l'articulation de chaque note. Melodyne prend en charge l'audio polyphonique mais uniquement pour un instrument à la fois.
Catégories de musique AI supplémentaires
Cet article devient déjà plus long que la plupart des gens ne peuvent en supporter. Certaines des catégories suivantes méritent à elles seules des articles entiers. Dans certains cas, nous avons déjà publié ces articles, nous vous y lierons donc. Sinon, nous partagerons des liens directement vers les entreprises que nous pensons que vous devriez connaître.
Générateurs de voix IA
Les deepfakes vocaux d'artistes grand public sont devenus viraux en 2023, avec une chanson d'AI Drake Heart on My Sleeve générant plus de vingt millions de flux en moins d'un mois. La musique IA est devenue synonyme de chansons IA et d'imitation de voix IA par extension.
Des géants de l'industrie du disque comme UMG se sont opposés à cette tendance, la citant comme une violation des droits de leurs artistes. Les journalistes n'ont pas tardé à capitaliser sur la controverse, écrivant des articles apocalyptiques sur la fin de la créativité humaine. Les mauvaises nouvelles ont tendance à circuler tandis que les bonnes nouvelles concernant les innovations légitimes et éthiques souffrent dans l'obscurité.
Pour en savoir plus sur des produits spécifiques, consultez notre article sur les meilleurs générateurs de voix IA pour les producteurs de musique .
Séparateurs d'IA vocale et instrumentale
Le fractionnement de stems est couramment utilisé pour supprimer les voix d'une piste existante. Spotify le fait dans le cadre de sa fonctionnalité de karaoké AI , par exemple, afin que les utilisateurs puissent chanter avec les versions instrumentales de leurs chansons préférées.
Pour les musiciens, le séparateur de tiges AI le plus populaire est Lalal.ai en raison de sa sortie et de son API de haute qualité, que de nombreuses autres entreprises ont étiquetées en blanc et reconditionnées sous leur propre marque. Il existe plusieurs autres options disponibles que vous pouvez lire ici .
Logiciel de mixage et de mastering IA
Le mixage et le mastering des pistes peuvent être difficiles, même si vous êtes un musicien chevronné. Auparavant, il nécessitait une oreille entraînée et du matériel coûteux, ce qui a ensuite cédé la place à des plugins DAW plus abordables.
L'intelligence artificielle a depuis marqué de son empreinte ces outils de mastering numériques. MusicRadar fournit une liste complète de plugins intelligents pour le mixage et le mastering ici . Pour une solution simple et rapide, Landr propose un outil de maîtrise de l'IA populaire qui s'exécute directement dans votre navigateur Web.
Ceci conclut notre aperçu des applications musicales AI en 2023. Nous espérons que vous avez découvert de nouveaux outils et que cette liste vous a donné une meilleure idée de ce qui existe. Abonnez-vous à notre liste de diffusion depuis la page d'accueil pour rester au courant des dernières nouveautés dans ce domaine.
Commentaires
Enregistrer un commentaire
🖐 Hello,
N'hésitez pas à commenter ou vous exprimer si vous avez des trucs à dire . . .👉