Dans tous les DVD les sous-titres sont des fichiers bruts. Si vous voulez ce sont de simples images incrustées sur le DVD. C'est là que SubRip entre en jeu.
Vous avez sans doute déjà voulu scanner un document et le retranscrire en texte avec un logiciel à reconnaissance d'écriture de type OCR ? Oui ? Et bien c'est ce que fait SubRip. Il va se charger de la reconnaissance d'écriture et vous permettra de convertir ces fichiers bruts en fichiers *.srt ou autres fichiers de type sous-titres texte.
Dans notre exemple, les fichiers *.VOB et *.IFO ont été générés et ceux-ci contiennent les sous-titres qui vont être utile à SubRip.
Lançons SubRip !
Cliquez sur
Cliquez sur
Cliquez sur et choisissez le format SubRip puis cliquez sur Convert to this Format.
Dans le champs Characters Matrix File, créez un fichier qui contiendra plus tard la reconnaissance de caractères (un travail de dure labeur )
Je vous conseille comme il est mis entre parenthèses de faire un fichier matrice par DVD. Pour moi et étant donné qu'il s'agit d'une série je créé deux fichiers (un par langue) ici XFiles_Eng.sum et XFiles_Fr.sum. Imaginez un peu le boulot si je dois me retaper la reconnaissance de caractère sur chaque DVD d'une série… vous allez comprendre pourquoi tout de suite…
Maintenant que tout est fait sélectionnez la langue du sous-titre. Pour moi ce sera English 1, 4:3.
Et c'est parti ! Cliquez sur Start.
La reconnaissance débute !
Dans mon exemple, le fichier XFiles_Eng.sum contenait déjà des caractères reconnus. Mais ne vous inquiétez pas au fur à mesure vous n'aurez plus rien à faire
Comme vous pouvez le voir ci-dessous
Du texte a donc déjà été retranscrit.
Pour moi par exemple j'ai juste eu la reconnaissance de la parenthèse en italique qui posait problème.
Je rentre ce caractère ( , je sélectionne Italic et je clique sur OK.
Si une reconnaissance bizarre sur certains caractères, comme ceux ci-dessous sont présents, il vaut mieux saisir TOUS les caractères.
Ici donc iffi en italique.
Une fois le traitement terminé, je n'ai plus qu'à sauvegarder le fichier matrice pour pouvoir le réutiliser plus tard et ainsi éviter de recommencer toute la reconnaissance pour un prochain épisode.
Pour la sauvegarde des sous-titres, voici la manipulation à effectuer.
Si la question suivante vous est posée, répondez NON.
Cliquez sur Save.
Si vous souhaitez encoder créer un nouveau sous-titre pour une autre langue, cliquez à nouveau sur puis sélectionnez par exemple ici Français.
ATTENTION : Avant de recommencer une nouvelle reconnaissance pour un nouvel épisode/film, créez un nouveau fichier matrice (sauf pour une série, les DVD étant semblables). Mais aussi faites un et un
pour réinitialiser le texte et la synchronisation des sous-titres.
Et ainsi de suite… Voilà pour le plus gros de l'extraction
et enregistrement des sous-titres au format texte.
VI. 4ème étape - Correction des sous-titres
Comme vous avez pu vous en rendre compte, SubRip n'est pas parfait et les sous-titres contiennent souvent des fautes d'orthographe et autres erreurs de syntaxe dû à un soucis de reconnaissance de caractères. Pour corriger ça, j'ai créé une petite appli en PHP/mySQL appelée SubRip ReCheck qui se chargera de corriger les plus grosses fautes à partir d'une base de donnée alimentée par mes soins au fur à mesure de mes checks.
J'essaierai plus tard de permettre aux utilisateurs d'alimenter la base de donnée avec les corrections que l'appli n'a pas trouvé mais que eux ont détecté…
Connectez-vous sur http://www.crazyws.fr/subrip_recheck et cliquez sur le bouton Traitement rapide.
Coller votre sous-titres issus du *.srt dans le champs texte, choisissez la langue et cliquez sur EXECUTER LE SCRIPT.
41 mots ont été remplacés sur les 173 mots du dictionnaire présents en base de donnée.
Voilà pour ce tuto j'espère qu'il vous aura aidé
MISES A JOUR DE L'ARTICLE |
Thank you for a good story, I really enjoyed your blog. Be sure to give a link to your friends!
Hello, I want to congratulate your site with 2010. I am sure that, in this new year, your article will please his readers.
Merci pour le tuto, et doublement pour le correcteur (collaboratif, pour ne rien gâcher).