Mode d'Emploi Détaillé de YelloRobo

Le Logiciel YelloRobo permet la capture des informations sur les entreprises, communiquées pour une consultation visuelle, par le site Internet des Pages Jaunes, sous la forme d'un tableau.
Il évite ainsi un très grand nombre de copier-coller et le travail très pénible de mise en forme qui s'ensuit, aux personnes qui ont besoin de ces informations, généralement pour alimenter une base de données prospects.

Sommaire du Mode d'Emploi Détaillé
1.
Lancement de YelloRobo
1.1 L'écran d'accueil
1.2 Le système d'Aide
1.3 L'écran de Capture
2. Saisie des paramètres de capture
2.1 Choix de l'activité
2.2 Choix de la zone géographique
2.3 Capture éventuelle des sites Internet
2.4 Affichage en premier des Entreprises avec sites ou avec des publicités
2.5 Examen du résultat correspondant aux paramètres de capture
3. La capture proprement dite
3.1 Lancement de la capture
3.2 Suivi de la capture
3.3 Arrêt de la capture
3.4 Reprise en cas d'arrêt imprévu
4. Exploitation du résultat de la capture
4.1 Le tableau temporaire de capture
4.2 Sauvegarde du tableau de capture
4.3 Importation du tableau de capture dans Déclic. Fichier YelloRobo.exp

1. Lancement de YelloRobo
Au lancement, YelloRobo propose la suppression des anciens fichiers temporaires de capture (s'il en existe).
Les  anciens fichiers temporaires de capture sont des fichiers au format "YR_JJ-MM-AA:hh:mm:ss" dont la date est antérieure à la date du jour.
Les fichiers temporaires de capture (sous ce format) doivent être renommés, avec un nom qui caractérise leur origine, si l'on souhaite les conserver.
1.1 L'écran d'accueil
L'écran d'accueil comporte:
. Une zone d'outils de navigation Internet, en haut et à gauche, contenant :
  . la zone "URL".
  . la zone "Statut", en dessous de la zone "URL" (zone en lecture seule, uniquement pour information).
  . le bouton "OK" qui affiche l'URL indiquée dans la zone.
  . les boutons "Précédente", "Suivante", "Actualiser".
     Ces boutons permettent, notamment de naviguer dans le système d'aide décrit ci-après.
. Le bouton "Contrôle à D." qui permet une prise en main à distance par l'Assistance Déclic.
. Le bouton "M. à J. Internet" qui permet le téléchargement de la dernière version de YelloRobo.
. La "Fenêtre d'Aide contextuelle" ,en haut et à droite, décrite ci-après.
. Le bouton "Démarrer" ,en haut et à l'extrême droite, qui permet d'afficher l'écran de capture décrit plus bas.
   Sous  le bouton "Démarrer" se trouve éventuellement le bouton "Licence", dans le cas d'une version d'évaluation.
.
Une page Internet, dans le corps de l'écran, contenant un message d'accueil et la "Prise en Main Rapide" décrite ci-dessous.

1.2 Le système d'Aide
Le système d'aide de YelloRobo, très élaboré, est basé sur les 3 éléments suivants:
. La "Fenêtre d'Aide Contextuelle", située en haut et à droite des écrans. Elle affiche en permanence, sur un fond jaune clair, une aide concise sur l'opération en cours.  
. La "Prise en Main Rapide" située dans l'écran d'Accueil. Cette "Prise en Main Rapide" est succincte (une page) mais permet néanmoins d'effectuer rapidement les premiers essais du logiciel. De plus, elle contient des liens hypertextes vers les paragraphes concernés du présent "Mode d'Emploi Détaillé", ce qui permet d'approfondir les points qui ne sont pas développés dans la "Prise en Main Rapide".
. Le présent "Mode d'Emploi Détaillé", complet, mais utilisable uniquement pour approfondir certains points, en fonction des besoins spécifiques.   

1.3 L'écran de Capture
L'écran Capture est similaire à l'écran d'accueil, avec comme principales différences :
. Le bouton "Démarrer" est remplacé par les boutons "Capturer" et "Arrêter la Capture".
. Les boutons de navigation ("Précédente", "Suivante", "Actualiser") sont remplacés par les boutons "? AIDE" et "Capture de Sites" (Cf. §2.3).
. Le corps de l'écran contient le site des Pages Jaunes en mode "recherche détaillée" (à la place de l'aide).
Pendant l'affichage de ce site, la fenêtre d'Aide Contextuelle invite à patienter pendant que le programme configure l'affichage des Pages Jaunes, ce qui prend quelques secondes. Elle affiche ensuite l'Aide pour la saisie des paramètres de capture.

2. Saisie des paramètres de capture
2.1 Choix de l'activité
Le choix de l'activité peut s'effectuer des deux façons suivantes :
. En utilisant la nomenclature arborescente des Pages Jaunes; pour cela il convient de cliquer sur le bouton "?" qui figure à droite de la zone "Activité" et qui affiche le début de la nomenclature.
. En utilisant le "moteur de recherche d'activités" des Pages Jaunes; pour cela il convient d'indiquer une description de l'activité dans la zone "Activité" et de choisir dans la liste des rubriques qui s'affichent, celles qui correspondent le mieux à la recherche. (voir figure de droite ci-dessous)

 
 
2.2 Choix de la zone géographique
De même, le choix de la zone géographique, peut s'effectuer des deux façons suivantes :
. En utilisant la nomenclature arborescente des Pages Jaunes; pour cela il convient de cliquer sur le bouton "?" qui figure à droite de la zone "Département ou région" et qui affiche la liste des 23 régions (figure ci-contre); cette liste permet soit de choisir une région, soit d'afficher les départements d'une région pour en choisir un.
. En indiquant directement une région, un département ou une ville dans les zones correspondantes.

2.3 Capture éventuelle des sites Internet 
La case à cocher "Capture de Sites" permet de renseigner la colonne "Site Internet" du tableau de capture.
Signalons que cette option ralentit fortement la capture (durée plus que doublée) et augmente le risque d'arrêt imprévu (blocage).
Notons que lorsque l'on est intéressé par les Sites Internet, il est souvent intéressant de valider l'option Pages Jaunes "Afficher en premier les Sites Web" et d'arrêter la capture après la dernière entreprise avec site Web.

2.4 Affichage en premier des Entreprises avec sites ou avec des publicités
Signalons la possibilité offerte par les Pages Jaunes d"Afficher en premier les entreprises avec Site Web" (intérêt exposé ci-dessus) et avec publicité ("Vidéo" ou "En savoir +"). On peut estimer que les entreprises avec publicité sont plus "dynamiques" que les autres.

2.5 Examen du résultat correspondant aux paramètres de capture
Une fois les paramètres saisis, comme indiqué ci dessus, il faut cliquer sur le bouton Pages Jaunes "trouver".
Ce bouton lance l'affichage de la 1ère page de résultat de 15 entreprises, avec en haut la zone d'information ci-dessus, contenant :
. le nombre de pages (de 15 entreprises chacune, sauf la dernière) prévues, ici 391.
. la "barre des pages", ici "1,2,3,4,5.....391, suivante, (un clic sur un numéro de page positionne sur cette page).
. le nombre d'entreprises trouvées, ici 5845 réponses dans la région.
Il est alors possible d'examiner les réponses, en parcourant les premières pages, pour vérifier qu'elle conviennent bien aux besoins.
Notons que l'ordre des réponses fourni par les Pages Jaunes est aléatoire.  

3. La capture proprement dite
3.1 Lancement de la capture

Pour lancer la capture, il suffit de cliquer sur le bouton "Capturer", en haut et à droite de l'écran.
Le programme prévient que la capture va s'effectuer à partir de la page actuelle. Il convient donc de se repositionner sur la première page si on l'a quittée.

3.2 Suivi de la capture
Il est important de noter que, pendant la capture, il ne faut utiliser ni la souris ni le clavier. L'exécution de tout autre programme en même temps que YelloRobo est déconseillé.
En haut et au centre, sont affichés le "Nombre de Captures" déjà effectuées, le "Nombre de Captures par Minute", la "Durée" actuelle de la capture.

3.3 Arrêt de la capture
La capture s'arrête dans les trois cas suivants:
. la dernière page a été capturée,
. l'utilisateur a cliqué sur le bouton "Arrêter la Capture",
. 200 entreprises ont déjà été capturées dans une version d'évaluation.
Dans ces trois cas, il est proposé d'ouvrir le tableau de capture décrit au §4.1

3.4 Reprise en cas d'arrêt imprévu
Il peut se produire un blocage du défilement des Pages Jaunes. Dans ce cas, il convient de reculer d'une page en utilisant la "barre des pages" et de lancer une nouvelle capture. On obtiendra alors deux fichiers de capture avec un recouvrement de 15 entreprises qu'il faudra supprimer manuellement.

4. Exploitation du résultat de la capture
4.1 Le tableau temporaire de capture

L'arrêt de la capture provoque, comme signalé en § 3.3, l'ouverture du fichier temporaire de capture.
Ce tableau comporte 11 colonnes avec les en-têtes suivantes:
Page_Ligne, Entreprise, Adresse, CodePostal, Ville, Téléphone1, Téléphone2, Fax, Email, Site, Activité
La 1ère colonne "Page_Ligne" contient, pour vérification éventuelle, les N° de Page et de Ligne dans la Page Jaune contenant l'entreprise concernée.
La colonne "Site" n'est renseignée que si la case à cocher "Capture de Site" a été renseignée.
Le tableau de capture est au format "Texte délimité par des tabulations" (les cellules d'une même ligne sont séparées par des tabulations).
Ce format présente les 3 avantages suivants :
. il est reconnu par tous les tableurs (format universel),
. il n'est pas limité en nombre de lignes, contrairement à tous les formats tableur, notamment Excel
. il génère des tableaux très légers, du point de vue de la taille des fichiers.

4.2 Sauvegarde du tableau temporaire de capture
Les fichiers de capture temporaires sont nommés "YR_" suivi de la date et l'heure de création ("YR_JJ.MM.AA-hh-mm-ss).
L'intérêt de cette dénomination est de ne pas écraser des fichiers antérieurement créés.
Pour éviter la prolifération de fichiers temporaires de capture, YelloRobo propose, au lancement,  la suppression des anciens fichiers temporaires (s'il en existe).
Les  anciens fichiers temporaires de capture sont les fichiers temporaires dont la date est antérieure à la date du jour.
Les fichiers temporaires de capture doivent être renommés, avec un nom qui caractérise leur origine, si l'on souhaite les conserver

4.3 Importation du tableau de capture dans Déclic. Fichier YelloRobo.exp
Les tableaux de capture sont, presque toujours, créés dans le but d'enrichir une base de données prospects, une base Déclic notamment.
Comme tous les tableaux, les fichiers de capture YelloRobo peuvent s'importer dans une base Déclic à condition de leur avoir inséré une ligne d'en-tête valide (avec la fonction "Insertion d'une ligne d'en-tête dans un tableau").
Si un modèle de champ nommé "YelloRobo.exp" se trouve dans le répertoire YelloRobo, il sera pris comme en-tête du tableau de capture.
Le tableau de capture sera alors directement importable dans la base Déclic.
Si le premier champ "Page_Ligne" n'est pas indiqué, il sera généré automatiquement. Ce champ sera "Ignoré" dans l'importation.

Signalons que les options avancées du logiciel Déclic Prospection permettent le dédoublonnage et la mise en forme du tableau de capture.