🤖 Construction de l'outil ultime d'analyse de l'IA pour YouTube
En tant que programmeur, je devrais tout savoir sur les algorithmes, mais l'algorithme de YouTube a toujours été un peu mystérieux. Parfois, il recommande des vidéos que je crée, et d'autres fois, il les ignore simplement. Rien que cette année, il semble qu'il y ait eu plus d'outils d'IA créés que de types de fromage, alors j'ai voulu voir si je pouvais exploiter la puissance de l'IA pour décrypter l'algorithme de YouTube. Mes objectifs sont triples : tout d'abord, je veux créer de meilleures vidéos. Cela semble un peu méta, mais j'aime toujours développer des idées en public. Deuxièmement, je veux concevoir les miniatures les plus attrayantes que je puisse imaginer, celles qui obtiennent un taux de clic plus élevé et qui ne sont pas des pièges à clics. Troisièmement, je veux que l'IA m'aide à créer des titres intéressants, uniques et auxquels les gens ne peuvent s'empêcher de cliquer.
Jour Zéro : Étude de marché
Avant de commencer tout nouveau SAS, produit ou service, une étude de marché est nécessaire. J'ai fait quelques recherches sur Google et j'ai vu qu'il y avait déjà des entreprises comme VidIQ et Chewbuddy qui font un peu la même chose. Elles sont devenues populaires récemment avec la croissance de YouTube et ont commencé à intégrer des outils d'OpenAI dans leur suite existante. J'aime en fait leur outil de suggestion de titres, mais toutes les entreprises sous le soleil ajoutent ces jours-ci ChatGPT à leur service. Donc, plutôt que de simplement faire cela, je voulais aller plus loin. Ce que je voudrais, c'est qu'une IA examine mes vidéos et me dise réellement quelles parties sont intéressantes et lesquelles sont ennuyeuses. Cela m'aiderait à l'étape de montage vidéo pour créer du contenu pertinent sans ennuyer personne. J'ai mentionné que je voulais faire des tests AB avec les miniatures, quelque chose qui m'aiderait à examiner les designs de miniatures et peut-être même me donner des tags et des suggestions pour ce qui fonctionnerait mieux. Peut-être qu'une étape supplémentaire consisterait à pouvoir même apporter des ajustements à la miniature réelle en temps réel, comme supprimer les arrière-plans, changer les arrière-plans, les visages et autres. Idéalement, je n'aurais pas à ouvrir Photoshop et à faire manuellement ces changements. Au lieu de cela, en utilisant les capacités de l'IA générative pour les créer pour moi en temps réel. La dernière chose que je veux faire est de voir si je peux intégrer Del 3 pour examiner mes vidéos. Je pense peut-être combiner quelque chose comme des sous-titres avec des images fixes de la vidéo comme contenu image que Del3 peut analyser, puis voir s'il peut également examiner les vidéos pour moi.
Jour Deux : Construction du front-end et du back-end
J'ai besoin d'un front-end et d'un back-end pour construire cela, et j'ai remarqué que Next.js a sorti une nouvelle version de leur framework, la version 14, qui est également maintenant côté serveur en termes de composants React. Je n'ai jamais utilisé Next.js auparavant, donc j'ai pensé que ce serait une excellente occasion d'apprendre comment cela fonctionne pour ce projet. Avec une solution full-stack, j'ai besoin d'un moyen pour les utilisateurs de s'inscrire et de se connecter. J'ai trouvé ce package appelé NextAuth, qui est une solution d'authentification pour Next.js. Il permet aux utilisateurs de se connecter avec plusieurs types de fournisseurs. Cependant, étant donné que mon idée concerne principalement YouTube, je vais le limiter aux utilisateurs Google qui ont des comptes YouTube. Ce n'était pas si facile. Cela m'a demandé de configurer une configuration avec la console de développement Google et d'activer l'API de données YouTube et l'API d'analyse, mais ça a fonctionné. Je pouvais maintenant permettre aux utilisateurs de se connecter, et ensuite un jeton serait généré et capturé pour que je puisse consulter les données de leur compte YouTube.
Jour Trois : Construction du front-end
J'ai créé une page d'accueil rapide avec un seul bouton pour me permettre de me connecter à mon compte. Ensuite, en utilisant Next.js, j'ai réellement créé une simple route API. Pour cette route, je voulais simplement extraire les détails de ma propre chaîne en tant qu'objet que je pourrais ensuite transmettre à un composant React. J'ai cependant rencontré un petit problème. Au bout de quelques heures, je ne pouvais plus utiliser le jeton pour effectuer des requêtes vers l'API de YouTube. C'est parce que j'avais un jeton d'accès, mais j'avais aussi un jeton de rafraîchissement, que je ne stockais pas, et j'avais besoin de l'utiliser pour rafraîchir le jeton d'accès. Sinon, il expirerait. Cela signifie que j'avais besoin d'une base de données et d'un endroit pour stocker toutes ces informations. Non seulement pour stocker le jeton de rafraîchissement et le jeton d'accès, mais aussi pour stocker les détails que j'obtiens, car je préfère les mettre en cache dans une base de données plutôt que de les appeler à partir de l'API de YouTube à chaque fois, car sinon je pourrais épuiser mon quota de YouTube car ils ne vous donnent qu'un certain nombre d'appels que vous pouvez faire. Je pense que c'était quelque chose comme 10 000 000 d'unités d'API, et chaque interaction utilise une quantité différente d'unités par jour, qui se réinitialise. Donc, à la place, je vais stocker cela dans une base de données. Cela m'a emmené jusqu'au jour quatre. Je me suis dirigé vers et j'ai créé une base de données partagée gratuite sur le Cloud, puis je l'ai utilisée pour interagir avec ces données. J'ai créé quelques modèles simples dans mon code ici pour les utilisateurs, les vidéos, les chaînes, et je les utiliserai pour stocker les informations lorsque l'utilisateur se connecte.
Jour Cinq : Introduction de l'IA
Maintenant que j'ai un cadre de travail avec lequel jouer, je veux introduire un peu d'IA pour voir si je peux analyser davantage les miniatures, les titres ainsi que les vidéos. Pour cela, je vais avoir besoin de trouver une plateforme qui me permette réellement de faire des requêtes API avec des appels API pour les images et les vidéos. C'était en fait assez difficile à trouver. Je sais que j'ai déjà apprécié MidJourney, mais ils n'ont pas de service API, et ils ne font pas vraiment de vidéo non plus. Finalement, j'ai trouvé un service appelé Cloudinary. Non seulement ils avaient de l'IA générative pour les vidéos et les images, mais ils avaient aussi des fonctionnalités d'IA très intéressantes basées sur le contenu que je voulais tester. Le meilleur, c'est que je n'ai pas eu à aller sur Discord pour faire cela. Au lieu de cela, je pouvais consulter leur documentation, et ils avaient des appels API pour à peu près tous les langages, et je pouvais même simplement passer une URL pour créer un appel API à la volée. Je les ai contactés, et ils ont eu la gentillesse de sponsoriser cette vidéo.