ENGLISH VERSION |
|
Links | | | Forum | | | Kommentare | | | News melden |
Chat | | | Umfragen | | | Newsticker | | | Archiv |
amiga-news.de Forum > Programmierung > ISO-Entities in GoldED | [ - Suche - Neue Beiträge - Registrieren - Login - ] |
-1- 2 | [ - Beitrag schreiben - ] |
25.10.2004, 13:52 Uhr _PAB_ Posts: 3016 Nutzer |
Hallo, ich suche ein Makro, welches in GoldED Studio 6 das bisherige Webworld-Plugin ablösen könnte um die Umwandlung von Umlauten etc. in ISO-Entities vornimmt. Beispiel: <FONT FACE="Helvetica, Arial">"> Hä ?" <A HREF="/cgi?act=answer&text=x">Antworten</a></font> sollte umgewandelt werden in: <FONT FACE=& quot;Helvetica, Arial& quot;>& quot;& gt; H& auml; ?& quot; <A HREF=& quot;/cgi?act=answer& amp;text=x& quot;>Antworten</a></font> Man beachte die Umwandlung von "&" in allen URLs, was der alte ISO-Entity-Konverter nicht macht. Hat jemand dafür eine W3C-konforme Lösung anzubieten ? Edit: Ich mußte Leerzeichen nach den "&"s einfügen, damit das Forum diese nicht umwandelt. [ Dieser Beitrag wurde von _PAB_ am 25.10.2004 editiert. ] [ - Antworten - Zitieren - Direktlink - ] |
25.10.2004, 14:10 Uhr Robin Posts: 1056 Nutzer |
Wenn deine Seiten halbwegs einem HTML-Standard entsprechen kannst du 'tidy' dafuer benutzen. Bin selbst gerade dabei meine Homepage von "HTML 3.2/funktioniert,muss also richtig sein" auf "HTML 4.0/validiert" umzustellen. Tidy kann extrem viel rausreissen. Auch nicht geschlossene Tags und sowas ... -- Bild: http://my.morphosi.net/cgi-bin/mnet.pl?mode=forum&showsmilie=baby2 AMIGA-News Babysitter gesucht ! [ - Antworten - Zitieren - Direktlink - ] |
25.10.2004, 15:56 Uhr Holger Posts: 8116 Nutzer |
Wozu eigentlich? Es ist doch wesentlich einfacher, im Header das Encoding "iso-latin-1" zu spezifizieren und die Umlaute so zu lassen. Ansonsten ist Deine Frage nicht ganz verständlich. Du willst einen Konverter haben, der die URLs so, wie von Dir angegeben (also komplett falsch) konvertiert? mfg -- Good coders do not comment. What was hard to write should be hard to read too. [ - Antworten - Zitieren - Direktlink - ] |
25.10.2004, 16:47 Uhr Valwit Posts: 750 Nutzer |
Zitat: grundsätzlich sollte die kodiereung sowieso spezifiziert sein, PAB braucht aber ein makro um & in & umzuwandeln. in ged5 kann man selber eines aufnefmen dass erst alle "&" in "& amp;" umwandelt (replace) und dann alle ev. "& amp;amp;" in "& amp;" umwandelt. golded6 scheint da komplizierter zu sein :> -- Viele Grüsse Valwit [ Dieser Beitrag wurde von Valwit am 26.10.2004 editiert. ] [ - Antworten - Zitieren - Direktlink - ] |
25.10.2004, 22:11 Uhr _PAB_ Posts: 3016 Nutzer |
@Valvit: Das Problem bei Deinem Makro-Vorschlag ist, daß ein bereits vorhandenes & quot; zB. in ein & amp;quot; konvertiert würde. Ich suche einen Ersatz für den GoldED ISO-Konverter, da ich keine Lust habe erst zwei verschiedene Befehle auszuführen (und auch kein externes Programm), bevor ich die Datei hochladen kann. Auch möchte ich keinen Zeichensatz spezifizieren, da es generell auf jedem System laufen soll, auch mit einem HTML 3.2-only Browser sozusagen. Eine Zeichensatz-Angabe ist ja nicht zwingend erforderlich, soweit ich das bisher gesehen habe. Ich hatte ja schonmal bei Dietmar Eilert nachgefragt, ob ich nicht den ISO-Konverter verbessern könnte, aber er hatte leider abgelehnt, da er mir dafür zu großen Einblick in seine Sourcen geben müßte. [ - Antworten - Zitieren - Direktlink - ] |
25.10.2004, 22:14 Uhr _PAB_ Posts: 3016 Nutzer |
@Holger: Ich werde es tunlichst unterlassen meine Seiten in irgendeinem Zeichensatz zu kodieren, da ich oft auf sehr verschiedenen Systemen mit ganz unterschiedlichen Zeichensätzen arbeite und die Seiten im Prinzip überall ohne Verlust der Sonderzeichen editieren können will. [ - Antworten - Zitieren - Direktlink - ] |
26.10.2004, 02:45 Uhr Valwit Posts: 750 Nutzer |
Zitat: ein durchlauf der & amp;quot; in & quot; umawandelt ist natürlich zu viel. da hast du recht. -- Viele Grüsse Valwit [ Dieser Beitrag wurde von Valwit am 26.10.2004 editiert. ] [ Dieser Beitrag wurde von Valwit am 26.10.2004 editiert. ] [ - Antworten - Zitieren - Direktlink - ] |
26.10.2004, 02:46 Uhr Valwit Posts: 750 Nutzer |
Zitat: ROTFL!!!!! schade dass es zu lang ist für eine signatur -- Viele Grüsse Valwit [ - Antworten - Zitieren - Direktlink - ] |
26.10.2004, 08:45 Uhr Robin Posts: 1056 Nutzer |
Kein externes Programm ? Na ja, war nur ein Vorschlag Vielleicht kannst du ja auch Serverseitig die angeforderten Dateien mit tidy ausliefern so wie ich das mache -- Bild: http://my.morphosi.net/cgi-bin/mnet.pl?mode=forum&showsmilie=baby2 AMIGA-News Babysitter gesucht ! [ - Antworten - Zitieren - Direktlink - ] |
26.10.2004, 10:39 Uhr _PAB_ Posts: 3016 Nutzer |
@Valvit: Nur zu schade, daß mir ein zweiter Durchlauf die "echte" & amp; wieder rausschmeißt ! Jaja, mach Dich nur lustig. Versuche Du doch mal mit verschiedenen Zeichensätzen die gleiche Datei zu bearbeiten ! [ - Antworten - Zitieren - Direktlink - ] |
26.10.2004, 11:46 Uhr whooha Posts: 41 Nutzer |
Zitat:Warum schreibst Du in den URLs nicht gleich "& amp;" statt "&" ? [ Dieser Beitrag wurde von whooha am 26.10.2004 editiert. ] [ - Antworten - Zitieren - Direktlink - ] |
26.10.2004, 12:09 Uhr Holger Posts: 8116 Nutzer |
Zitat:Vielleicht hast Du es ja noch nicht bemerkt, aber so kann es einfach nicht funktionieren. Du willst eine Datei bearbeiten, dann konvertieren, dann wieder bearbeiten und dann wieder konvertieren. Woher soll ein Programm wissen, welche & Zeichen von Dir gewollt, welche ungewollt und welche das Ergebnis eines vorhergehenden Konvertierungsprozeß sind? Es gibt keine Software, die hellsehen kann. Wenn Du auf dieser Ebene arbeiten willst, dann mußt Du eben Html-Entities von Hand eingeben. Allerdings kann ich nicht nachvollziehen, auf wieviel verschiedenen Systemen und welchen exotischen Zeichensätzen Du die Datei bearbeiten mußt. Da die Editoren auf diesen exotischen Systemen vermutlich auch kein entsprechendes PlugIn besitzen, wirst Du wohl oder übel die ¨-Sequenzen von Hand eingeben müssen. Und dann spielt es ja auch überhaupt keine Rolle mehr, welches Encoding dieses System hat, da Du nur ASCII-Zeichen eingibst, und die anderen Zeichen so abgespeichert werden, wie sie auch geladen wurden. mfg -- Good coders do not comment. What was hard to write should be hard to read too. [ - Antworten - Zitieren - Direktlink - ] |
26.10.2004, 15:36 Uhr Valwit Posts: 750 Nutzer |
Zitat: ich benutze iso-8859-2 und 8859-15 bzw 8859-1, manchmal auch lustige sachen wie cp-1250 oder amiga-pl. das sind schon 4 kodierungssysteme. bei jeder html-seite definiere ich die kodierung, entieties gebe ich von hand ein oder benutze die dinger di in ged drinn sind. aber ich habe den einfachen weg gewählt: ich halte mich an standards und versuche nicht eigene zu definieren. -- Viele Grüsse Valwit [ - Antworten - Zitieren - Direktlink - ] |
27.10.2004, 00:00 Uhr _PAB_ Posts: 3016 Nutzer |
@Holger: > Woher soll ein Programm wissen, welche & Zeichen von Dir gewollt, welche ungewollt (...) Beim bisherigen ISO-Konverter von GoldED funktioniert das ganz gut. Die "&"-Zeichen, die bereits Bestandteil einer gültigen ISO-Entity sind werden nicht nochmal konvertiert, alle anderen (außer in einem HTML-Tag!) werden in "& amp;" konvertiert. Im Prinzip wäre es am einfachsten den alten ISO-Konverter zu ändern, nur wird Dietmar Eilert das wohl kaum machen und die Sourcen wird er auch nicht rausgeben fürchte ich. *träum* GoldED Studio 6 unter APL oder LGPL ? *träum* [ - Antworten - Zitieren - Direktlink - ] |
27.10.2004, 10:52 Uhr Solar Posts: 3680 Nutzer |
Sag mal, sag mal... Weißt Du eigentlich, wofür ISO-Entities da sind, und wofür nicht? Zunächst einmal: Alle Zeichensätze, die Dir auf quasi allen heute gebräuchlichen Maschinen begegnen können, behandeln den "Grundzeichensatz" identisch. Das umfaßt a-z, A-Z, 0-9, und auch Zeichen wie <, >, &, und ". Keine Konvertierung nötig. < und > werden nach < und > maskiert, um Verwechselungen mit HTML-Tags zu vermeiden. & wird nach & maskiert, um Verwechselungen mit maskierten Entities zu vermeiden. " wird nach " maskiert, weil... ich vermute mal, die Anführungszeichen national unterschiedlich sein können. HTML- oder Zeichensatztechnisch gibt's keinen Grund. Und dann sind da die Umlaute (z.B. "ä" -> ä, "ß" -> ß). Diese werden maskiert, weil sie nicht zum Grundzeichensatz gehören, die sie maskierenden Zeichen aber schon. Ta-Daaaa... Deine Datei ist vom Zeichensatz unabhängig. Genau so, wie GoldED es macht. Und jetzt erkläre mir noch einmal genau, warum Du z.B. die Anführungszeichen innerhalb eines HTML-Tags maskieren willst. [ - Antworten - Zitieren - Direktlink - ] |
27.10.2004, 10:55 Uhr Solar Posts: 3680 Nutzer |
Zitat: Ich dachte mir schon, daß Du die Sache mit der Maskierung nicht richtig verstanden hast. Wie Du vielleicht bemerkt hast, brauchte ich in meinem Posting keine Leerzeichen... (""" -> ") [ - Antworten - Zitieren - Direktlink - ] |
28.10.2004, 00:43 Uhr _PAB_ Posts: 3016 Nutzer |
@Solar: Warum einfach, wenn es kompliziert geht ? Mit "& quot;" gehts es im Forum auch und jeder versteht es. > Und jetzt erkläre mir noch einmal genau, warum Du z.B. die > Anführungszeichen innerhalb eines HTML-Tags maskieren willst Will ich garnicht, es geht um "&" innerhalb einer URL, die GoldED nicht in "& amp;" konvertiert, weil sie (innerhalb eines HREF, also) innerhalb eines HTML-Tags liegen. Dieses Verhalten ist eigentlich gegen den Standard, auch wenn sich viele nicht wirklich darum kümmern. Was die Zeichensätze angeht: ich tippe zB. auf Linux ein "ä" und kovertiere dann die Datei mit GoldED, wenn ich wieder zuhause bin. Resultat ist irgendein komischer "& #xxx;"-Code, der nur auf Systemen mit dem gleichen Zeichensatz korrekt dargestellt wird, weil das "ä" auf Linux nicht identisch mit dem "ä" auf dem Amiga ist. [ - Antworten - Zitieren - Direktlink - ] |
28.10.2004, 01:09 Uhr whooha Posts: 41 Nutzer |
Zitat:Kann der Amiga kein iso-8859-1? Bei mir zeigen more und ed(wb3.1) auch die unter Linux in iso-8859-1 getipperten "ä"s an... Und wenn Du auf Linux ein "ä" tippst, könntest Du die Datei vor dem Nachhausegehen auch gleich in das "richtige" Characterset umwandeln, da gibs Tools(z.B. konwert) für, und bestimmt auch das Characterset, daß Du für GoldEd brauchst. [ Dieser Beitrag wurde von whooha am 28.10.2004 editiert. ] [ - Antworten - Zitieren - Direktlink - ] |
28.10.2004, 01:37 Uhr Valwit Posts: 750 Nutzer |
Zitat: weil es unicode ist. amiga kann das nicht. stelle die linuxshell auf iso 1 oder 15 um und das problem ist erledigt. -- Viele Grüsse Valwit [ - Antworten - Zitieren - Direktlink - ] |
28.10.2004, 10:24 Uhr Solar Posts: 3680 Nutzer |
Zitat: Zeigt aber, daß Du bei den Details noch etwas konfus bist. Zitat: Aha... bei einem <a href="http://www.example.com/index.php?param1=X¶m2=Y"> möchtest Du also das & in ein & verwandelt haben sehen, weil Du meinst, das wäre "Standard"? Dann schau' Dir den Standard besser noch einmal an... Zitat: Das diese Konvertierung ein bißchen spät kommt - nämlich nach dem Wechsel auf ein System mit anderem Zeichensatz - sollte eigentlich klar sein...? Zitat: Ja, darum solltest Du es ja auch vor dem Übergang Linux -> Amiga konvertieren. Für GoldED ist es halt kein "ä", sondern irgendetwas komisches. AmigaOS verwendet übrigens grundsätzlich ISO Latin 1. [ Dieser Beitrag wurde von Solar am 28.10.2004 editiert. ] [ - Antworten - Zitieren - Direktlink - ] |
28.10.2004, 10:50 Uhr whooha Posts: 41 Nutzer |
Zitat:Der W3C Validator meckert bei &s in URLs, ist auch besser so: http://www.htmlhelp.com/tools/validator/problems.html#amp [ Dieser Beitrag wurde von whooha am 28.10.2004 editiert. ] [ - Antworten - Zitieren - Direktlink - ] |
28.10.2004, 11:40 Uhr Solar Posts: 3680 Nutzer |
Humpf... "I stand corrected". Also verbleibt von _PAB_'s Problemen genau dieser Punkt, der dann schickerweise sogar ein Bug ist statt einem "Missing Feature". Noch dazu einer, den Dietmar wahrscheinlich in Nullkommanix korrigieren könnte, wenn ihn jemand darauf aufmerksam macht... [ - Antworten - Zitieren - Direktlink - ] |
28.10.2004, 18:54 Uhr Holger Posts: 8116 Nutzer |
Zitat:Ich bin entsetzt. Die tippst unter Linux ein ä, liest die Datei unter AmigaOS ein, es ist immer noch ein ä, sonst wäre der nächste Schritt ja sinnlos, und konvertierst es dann zu ä und jetzt soll es falsch sein? Beschäftige Dich doch erst einmal mit der Materie. Alle Entities sind im Standard eindeutig definiert, egal ob benannte oder bezifferte. Diese Zahlenwerte sind grundsätzlich Unicode-codiert und nichts anderes. Schließlich ist der Sinn und Zweck ja der, daß man Zeichen unabhängig vom lokalen Zeichensatz spezifieren kann. Da die ersten 256 Zeichen des Unicode-Zeichensatzes exakt mit dem iso-latin-1 übereinstimmen, der auch unter AmigaOS der Standard ist (Hack&Patch lassen wir mal außen vor), funktionieren die Zahlenwerte auch mit den Amiga-Browsern, die kein Unicode beherrschen. Es gibt also nur genau einen richtigen Zahlenwert in einer Entity, der dem ä entspricht, und das ist 228. mfg -- Good coders do not comment. What was hard to write should be hard to read too. [ Dieser Beitrag wurde von Holger am 28.10.2004 editiert. ] [ - Antworten - Zitieren - Direktlink - ] |
29.10.2004, 00:05 Uhr _PAB_ Posts: 3016 Nutzer |
Das mit dem Zeichensatz ist sowieso hinfällig, war ein Vorschlag von Valvit (in den Kommentaren, nicht hier im Forum), den ich sowie nicht umsetzen kann, da ich an unseren Rechner in der Uni keinesfalls den Zeichensatz umstellen werde. Ich schreibe weiterhin nur in Dateien rein, die bereits ISO-Entities haben. @whooha: Danke für die Antwort an Solar. @Solar: Dietmar wird nichts mehr am ISO-Konverter von GoldED Studio 6 machen, den Fehler (und eineige andere Verbesserungsmöglichkeiten) habe ich ihm schon vor Jahren gemeldet... auch habe ich vorgeschlagen es selbst zu korrigieren, was er aber abgelehnt hat (wegen Einblick in die Sourcen). Soweit ich das sehen kann, macht er nur noch Updates für GoldED Studio AIX. Genau deshalb suche ich ja nach Ersatz. Und jetzt sag bitte keiner ich soll mir halt den AIX kaufen, das geht nicht, denn meine ganzen selbstprogrammierten Syntaxparser die ich täglich brauche sind für die 6er-API programmiert und laufen auf dem AIX nicht mehr. Derzeit habe ich keine Zeit mich um eine Portierung auf die AIX-API zu kümmern. [ - Antworten - Zitieren - Direktlink - ] |
29.10.2004, 08:02 Uhr Solar Posts: 3680 Nutzer |
Zitat: In einem guten Texteditor kannst Du den Zeichensatz der behandelten Datei einstellen, ohne an den globalen Systemeinstellungen herumbasteln zu müssen. Zitat: Na viel Spaß, immerhin sind Entities ziemlich aus der Mode gekommen.... Zitat: Tja. Dietmar hat nicht die Zeit sich um GoldED 6 zu kümmern, Du hast keine Zeit Dich um eine Portierung Deiner Syntaxparser zu kümmern... [ - Antworten - Zitieren - Direktlink - ] |
29.10.2004, 12:06 Uhr Holger Posts: 8116 Nutzer |
Zitat:Gibt's so einen auf dem Amiga? mfg -- Good coders do not comment. What was hard to write should be hard to read too. [ - Antworten - Zitieren - Direktlink - ] |
29.10.2004, 12:28 Uhr Solar Posts: 3680 Nutzer |
_PAB_ sprach von den Rechnern in der Uni, an deren Zeichensatz-Einstellungen er nicht schrauben wolle. Das es sich da um Amigas handelt, wage ich zu bezweifeln. [ - Antworten - Zitieren - Direktlink - ] |
29.10.2004, 15:34 Uhr _PAB_ Posts: 3016 Nutzer |
@Solar: Unter Linux ist mir kein solcher Editor bekannt. Erstrecht keiner, der in der Shell funktionieren würde. [ - Antworten - Zitieren - Direktlink - ] |
29.10.2004, 22:26 Uhr whooha Posts: 41 Nutzer |
@_PAB_: Emacs [ - Antworten - Zitieren - Direktlink - ] |
30.10.2004, 01:24 Uhr _PAB_ Posts: 3016 Nutzer |
@whooha: Schön, selbst wenn, es löst das eignetliche Problem nicht. [ - Antworten - Zitieren - Direktlink - ] |
-1- 2 | [ - Beitrag schreiben - ] |
amiga-news.de Forum > Programmierung > ISO-Entities in GoldED | [ - Suche - Neue Beiträge - Registrieren - Login - ] |
Impressum |
Datenschutzerklärung |
Netiquette |
Werbung |
Kontakt
Copyright © 1998-2024 by amiga-news.de - alle Rechte vorbehalten. |