![]() |
html parser elemente formatieren - Druckversion +- Javascript-forum (https://javascript-forum.de) +-- Forum: Entwicklung (https://javascript-forum.de/Forum-entwicklung--4) +--- Forum: Php (https://javascript-forum.de/Forum-thema-php--5) +--- Thema: html parser elemente formatieren (/Thread-thema-html-parser-elemente-formatieren--2232) |
html parser elemente formatieren - BastiBln - 17.03.2023 Moin, ich benötige mal euren Rat. Ich habe mit der simple_html_dom lib einen Parser für Rezepte von chefkoch.de gebaut. Um die Zutaten für meinen Bedarf zu verwenden benötige ich eine bestimmte Formatierung. Ich probiere schon eine ganze Weile rum, aber es funktioniert nicht so richtig. Hier der Code:
Das funktioniert soweit und erzeugt die Ausgabe je Zeile: [Menge] [Einheit] [Bezeichung] [Bezeichnung] [Bezeichnung](n); Was ich aber benötige ist: [Menge],[Einheit],[Bezeichnung Bezeichnung Bezeichnung (n)]; Ein einfaches str_replace() funktioniert leider nicht, das sieht dann als Bsp. so aus: 800,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,g,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Tafelspitz,vom,Rind; 1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Port.,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Suppengemüse,(Lauch,,Sellerie,,Zwiebel,,Möhre); 3,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Lorbeerblätter; 1,½,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Liter,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Gemüsebrühe,oder,Fleischbrühe; 2,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Gemüsezwiebel(n); 1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,EL,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Senf,,mittelscharfer; 2,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,EL,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Butter; 1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,EL,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Mehl; 5,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,cl,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Weinessig; 1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,EL,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Zucker; Salz,und,Pfeffer; Test URL: https://www.chefkoch.de/rezepte/802421184050733/Westfaelisches-Zwiebelfleisch.html Woher die vielen 'Leerzeichen' kommen, konnte ich bis jetzt nicht nachvollzeihen. Im DOM sieht man nichts davon. Eine weitere foreach()-Aufsplittung war bis auch nicht erfolgreich. Hat mir wer einen Tipp? Vielen Dank! RE: html parser elemente formatieren - rzscout - 18.03.2023 Moin BastiBln, leider verwende ich dieses Modul/Extension garnicht. Aber ich habe eine Doku gefunden: https://enb.iisd.org/_inc/simple_html_dom/manual/manual.htm Ich hoffe es hilft dir weiter. RE: html parser elemente formatieren - BastiBln - 18.03.2023 Hi, danke. Das Manual ist mir bekannt. Leider kann man nicht kleinteiliger parsen, die Zutaten stehen im orig. html in nur einer Zeile (tr), die einzelnen Elemente stehen nicht nochmal in tags, td z.Bsp. Ich denke ich müsste jede Zeile noch einmal in ein array aufsplitten und dann jede Zeile neu zusammensetzten. Leider fehlt mir noch die Vision wie man das am Dümmsten macht. RE: html parser elemente formatieren - rzscout - 18.03.2023 Hi BastiBln, ich versuch mal mein Bestes und lese mich mal da ein. Hast du eventuell andere Methoden um den Inhalt zu lesen und bestimmte Elemente zu selektieren? VG rzscout RE: html parser elemente formatieren - BastiBln - 19.03.2023 Hi, vielen Dank! Nicht dass ich wüsste, parse libs funktionieren ja vermutlich alle gleich; man kann nach html-tags oder klassen selektieren. Leider hat die Darstellung der Zutatenliste bei chefkoch nur eine Klasse in table, danach kann man nur noch nach html-tags filtern/selektieren damit die Liste vollstänig ist. VG Hi, alles Quatsch, hab eben nochmal geschaut, die td-tags haben doch eine eigene Klasse nach der man nochmal selektieren kann:
Ausgabe: ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,800,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,g,,,,,,,,,,,,,,,,,,,,,,,,,,,, Tafelspitz vom Rind ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Port.,,,,,,,,,,,,,,,,,,,,,,,,,,,, Suppengemüse (Lauch, Sellerie, Zwiebel, Möhre) ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,3,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, Lorbeerblätter ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,½,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,Liter,,,,,,,,,,,,,,,,,,,,,,,,,,,, Gemüsebrühe oder Fleischbrühe ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,2,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, Gemüsezwiebel(n) ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,EL,,,,,,,,,,,,,,,,,,,,,,,,,,,, Senf, mittelscharfer ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,2,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,EL,,,,,,,,,,,,,,,,,,,,,,,,,,,, Butter ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,EL,,,,,,,,,,,,,,,,,,,,,,,,,,,, Mehl ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,5,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,cl,,,,,,,,,,,,,,,,,,,,,,,,,,,, Weinessig ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,EL,,,,,,,,,,,,,,,,,,,,,,,,,,,, Zucker Salz und Pfeffer Jetzt müssen nur noch die vielen Kommata weg, dann passt es. RE: html parser elemente formatieren - BastiBln - 20.03.2023 So, ich habs hinbekommen. Scheinbar hinterlässt strip_tags() jede Menge whitespaces, oder der parser. So funktioniert es jetzt:
|