so... nach einigen seiten "Mastering regular expressions" [1] (das buch kann ich nur empfehlen)
hab ich zumindestens eine lösung: ich wandle alles um und mache es dann innerhalb des <a href"-Tags wieder rückgängig
und zwar wie folgt:
Code:
sed -r 's/(<a href=)(.*)(<span style=.*FFFF00\\">)(.*)(<\/span>)/\1\2\4/g' dateiname
leider hab ich jetzt folgendes problem. das ganze funktioniert bei diesem einfachen beispiel ohne probleme... die regexp trifft zu
Code:
akhafk Wsjfs fasgfsg <a href="www.langerlink.<span style=\"background-color:\#FFFF00\">Klaus</span>.de">Speziale</a>
leider aber nicht bei
Code:
<a href="http://scitation.aip.org/vsearch/servlet/VerityServlet?KEY=ALL&possible1=Paris,+<span style="background-color:#FFFF00">Mark</span>+W.&possible1zone=author&maxdisp=25&smode=strresults&aqs=true">Mark W. Paris</a><BR>
<a href="http://scitation.aip.org/vsearch/servlet/VerityServlet?KEY=ALL&possible1=Skoko,+Dunja&possible1zone=author&maxdisp=25&smode=strresults&aqs=true">Dunja Skoko<!--aqs--></a>, <a href="http://scitation.aip.org/vsearch/servlet/VerityServlet?KEY=ALL&possible1=Yan,+Jie&possible1zone=author&maxdisp=25&smode=strresults&aqs=true">Jie Yan<!--aqs--></a>, <a href="http://scitation.aip.org/vsearch/servlet/VerityServlet?KEY=ALL&possible1=<span style="background-color:#FFFF00">Johnson</span>,+Reid+C.&possible1zone=author&maxdisp=25&smode=strresults&aqs=true">Reid C. Johnson<!--aqs--></a>, and <a href="http://scitation.aip.org/vsearch/servlet/VerityServlet?KEY=ALL&possible1=<span style="background-color:#FFFF00">Mark</span>o,+John+F.&possible1zone=author&maxdisp=25&smode=strresults&aqs=true">John F. Marko<!--aqs--></a><BR>
hat da jemand ne idee? oder vielleicht entdeckt vielleciht jemand den fehler?
hinweise?!
moe
[1] J. Friedl, OReilly 2002
Lesezeichen