/* Programme récupérant uniquement les adresses des  liens cliquables 
 sur la page qui sont ecrits sous la forme <a href="lien" ..>...</a>

*/

public class LiensPageWeb {
    public static void main(String [] args) {
	int etat =0;
	Lecture entree = new Lecture(args[0]);
	Ecriture sortie = new Ecriture(args[1]);
	entree.init();
	sortie.init();
	String ligne;
	String lien ="";
	char lettre;
	while ((ligne = entree.lit()) != null){
	    for (int i =0; i< ligne.length(); i++){
		lettre = ligne.charAt(i);	    
		switch(etat){
		case 0 : if (lettre=='<') etat =1; //< 
		    break;
		case 1 : if (lettre=='a') etat  =2; //<a 
		else if (!(lettre=='<')) etat = 0;
		    break;
		case 2 : if (lettre==' ') etat = 3; 
		else etat = 0; 
		    break;
		case 3 : if (lettre=='h') etat =4;
		else etat =0;
		    break;
		case 4 : if (lettre=='r') etat =5;
		else etat =0;
		    break;
		case 5 : if (lettre=='e') etat =6;
		else etat =0;
		    break;
		case 6 : if (lettre=='f') etat =7;
		else etat =0;
		    break;
		case 7 : if (lettre=='=') etat =8;
		else etat =0;
		    break;
		case 8 : if (lettre=='"') etat =9;
		else etat =0;
		    break;
		case 9 : //etat de lecture de l'adresse <a href=".... 
		    if (lettre=='"'){ // fin de lecture  <a href="...."
		    etat = 0;
		    sortie.ecrit(lien);
		    lien ="";
		}
		else lien = lien+lettre;
		}
	    }
	};
			
	entree.ferme();
	sortie.ferme();
    }


}
