Category talk:SVG Deutsche Einheitskurzschrift

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search

It is highly recomended so read the discussion page before uploding files to this category

[edit]

Vor dem Hochladen von Dateien in diese Kategorie bitte Rücksprache mit mir halten, weil:

  • ich bin (bisher) der einzige Ersteller von Dateien für diese Kategorie
  • da ich noch monatelang massenhaft Dateien hochladen werde und dabei auch massenhaft alte Dateien durch Dateien mit schöneren Schriftzügen ersetze, könnte es leicht geschehen, dass ich deine Datei versehentlich überschreibe, denn das ist für mich momentan ein fast automatisierter Massenupload, bei dem ich nicht jedes einzelne Überschreiben überprüfen kann.
  • solltest du einzelne Dateien erstellen, dann ist das kein Problem, wenn du hier eine Liste mit deinen erstellten Dateien anlegst, damit ich den Überblick behalten kann welche Dateien nicht von mir sind und welche ich nach versehentlichem Überschreiben wiederherstellen muss (die Gründe sind ganz unten in der Diskussion angeführt: kurz - ich will 2022 ein Wörterbuch mit allen Dateien aus dieser Kategorie erstellen, kann das aber nur, wenn ich weiß welche Dateien von "Fremdlingen" dazu gekommen sind.
  • Solltest du massenhaft neue Dateien erstellen empfiehlt sich irgendein workaround für die Synchronisation unserer Datensätze (beispielsweise in dem du für einige Zeit eine weitere Kategorie erstellst und dort erst mal deine Dateien ablegst - ODER du kannst mir deine Dateien irgendwo im Internet zum Komplettdownload anbieten, damit ich beide Datensätze zusammenführen kann - ist nur ein Vorschlag für den Fall der Fälle - denn nur so ist sichergestellt, dass alle Dateien im geplanten "Stenografischen Wörterbuch" landen).

--Thirunavukkarasye-Raveendran (talk) 20:21, 18 September 2020 (UTC)[reply]

Datei-Download

[edit]

Alle Dateien in dieser Kategorie stehen unter folgenden Links zum Download bereit: (jedoch nicht tagesaktuell synchronisiert - letzte Version: 2021-11-13)

auf Dropbox (Version: 2021-11-13)
oder auf google-drive (Version: 2021-11-13).

Vorerste stelle ich die Arbeit an den Steno-Bildern ein, da der Massen-Upload nach Commons mit dem Programm Commonist nicht mehr funktioniert. Diesen benötige ich aber für diese Arbeit. --Thirunavukkarasye-Raveendran (talk) 14:09, 13 November 2021 (UTC)[reply]

Einheitliche Dateinamen - Namenskonvention für diese Kategorie

[edit]
Einzelwort: File:DEK Deutsche Einheitskurzschrift - Bockwürste
Ansonsten vor das führende "DEK" noch einen der folgenden Buchstaben mit nachfolgendem Leerzeichen:
A - Abkürzungen: File:A Deutsche Einheitskurzschrift - z. B. (zum Beispiel)
B - zwei Wörter: File:B DEK Deutsche Einheitskurzschrift - zwei Wörter
C - drei Wörter: File:C DEK Deutsche Einheitskurzschrift - Internationales Olympisches Komitee
E - englische Wörter
F - falsche Schreibweise (rot durchgestrichen): File:F DEK Deutsche Einheitskurzschrift - Badeanzug v2
G - Geographie: File:G DEK Deutsche Einheitskurzschrift - Leipzig (Elbe, Harz, Niederlande) (Straßen, Städte, Flüsse, Regionen, Länder, Kontinente, Gebirge, Seen, Meere, Inseln, Buchten...)
K - offizielles Kürzel der DEK Verkehrsschrift: File:K DEK Deutsche Einheitskurzschrift - über (Kürzelm aber auch Einzelbuchstaben und besondere Buchstabenverbindungen aus der Systemurkunde)
N - für nicht empfohlene Schreibweise (in eckigen Klammern): File:N DEK Deutsche Einheitskurzschrift -
O - Organisation (und Firmen, Marken): File:O DEK Deutsche Einheitskurzschrift - UNO (Deutsche Bank, ...)
P - Persone: File:P DEK Deutsche Einheitskurzschrift - Leonhard Euler (Vornamen, Familiennamen)
L - Latein
S - sonstige - Setzkasten, Ziffern, leere Datei mit Linien, mit Erläuterungen in Klammern im Dateinamen: File:O DEK Deutsche Einheitskurzschrift - wieviel (alte Rechtschreibung) ; meinen (von Meinung) ; Streitende (Großschreibung) ; A (Großbuchstabe)
T - längerer Text (mehrer als 3 Sätze)
U - Datei mit Unterscheidungszeichen (einschließlich Verbindungsstrich, Längen, Großbuchstaben, Apostroph u. ä.): File:U DEK Deutsche Einheitskurzschrift - Bett v2.svg
V - Vergleich - Dateien mit Vergleichen (ABER): File:V DEK Deutsche Einheitskurzschrift - Bohne ABER Beine
X - Buchstabenlisten, Kürzellisten: File:X DEK Deutsche Einheitskurzschrift - br cr gr tr kr rr
Y - konjugierte Verblisten: File:Y DEK Deutsche Einheitskurzschrift - ich sollte du solltest er sollte
Z - Sätze, Redewendungen, Sprichwörter, etwas längerer Text: File:Z DEK Deutsche Einheitskurzschrift - wir waren sogar vier Tage in Kanada bei der Bärenjagd



Bitte einheitlich das folgende Liniensystem verwenden:


In diese Kategorie bitte einheitliche Dateinamen, damit sich ein korrekte alphabetische Sortierung ergibt:

Beispiele:
"File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - b.svg" - Linienstärke 6
"File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - str.svg"
"File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Den ganzen Beispielsatz ans Ende des Dateinamens.svg"
"File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Tiger ABER Taiga.svg" - Bei Gengüberstellungen von zwei unterschiedlichen Wörtern, was in Steno-Lehrbüchern mit einem dazwischen gesetzten Doppelpunkt erfolgt, wird in den Dateinamen für diesen Doppelpunkt ein "ABER" in Großbuchstaben gesetzt

--Thirunavukkarasye-Raveendran (talk) 18:38, 31 March 2019 (UTC)[reply]


Wortgruppen (gewöhnlich 3 oder mehr Wörter) und ganze Sätze haben als Dateinamen ein vorangestellten großes (oder kleines) "z" mit nachfolgendem Leerzeichen, damit diese Dateien am Ende dieser Kategorie einsortiert werden. Beispiel: File:Z DEK Deutsche Einheitskurzschrift - Verkehrsschrift - wo ist der Anorak für Peter.svg --Thirunavukkarasye-Raveendran (talk) 21:35, 13 December 2019 (UTC)[reply]

Leere Übungsblätter

[edit]

Für schriftliche Übungen empfiehlt sich der Ausdruck der linierten leeren Blätter mit dem 4-Liniensystem aus einer der folgenden Dateien:


--Thirunavukkarasye-Raveendran (talk) 20:38, 10 March 2019 (UTC)[reply]

Korrekturen der Steno-Grafiken - Kritik

[edit]

Ich schlage für ein einheitliches Erscheinungsbild vor:

  • Neigung der Linien bitte einheitlich 30° (entspricht 60° in der Vertikalen)
  • Linienstärke 6, Farbe: schwarz,
  • Enden der Linien: rund (einstellen), Knicke in den Linien: rund (einstellen)

--Thirunavukkarasye-Raveendran (talk) 18:14, 4 May 2019 (UTC)[reply]

unklare Schreibung und Fehlermeldung

[edit]
Stehgreif - mit oder ohne "h" schreiben? File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Stehgreif.svg (mit h) - File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Stehgreif v2.svg (ohne h)
File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Schachtelsatz.svg (rechtswendiges s) - File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Schachtelsatz v2.svg (linksweniges s nach L - auch an Wortsilbenfugen?)

Ausführliche Diskussionen eventuell auf der Diskussionsseite der jeweiligen Datei. Aber hier bitte ansagen. --Thirunavukkarasye-Raveendran (talk) 20:06, 6 December 2020 (UTC)[reply]

Vorschläge/Wünsche neue Einträge

[edit]

Ich schaue hier regelmäßig vorbei. --Thirunavukkarasye-Raveendran (talk) 20:04, 6 December 2020 (UTC)[reply]

Hinweis an Thirunavukkarasye-Raveendran: Seit ein paar Tagen weiss ich von einem Stenogenerator für die Verkehrsschrift der DEK. Nach Blick in das Handbuch vermute ich, dass dabei vielleicht entweder zahlreiche Deiner Tafeln an-sich, oder in einer weiterverarbeiteten Form (etwa Wortliste, oder Muster aus dem Setzkasten), dort eingesetzt werden, um eine Ausgabe in .svg, .pdf, .html, oder .epub anzubieten. (Absichtlich im Konjunktiv formuliert, denn das Innere des Programmes kennt nur der Autor.) Mit ersten Editionen (auch simultan Langschrift und Symbolisierung auf einer Seite) wie Faust I scheinen durchaus auch schon «längere Werke» umsetzbar.--Pythonik (talk) 10:01, 14 February 2021 (UTC)[reply]

Hab ich neulich auch schon gefunden. Ich dachte schon, dass das meine ganze Arbeit hinfällig macht. Konkurrenz belebt das Geschäft. ABER der erste Praxistest hat mich nicht umgeworfen. Anwendungsbereit scheinen nur 1000 Wörter in der Datentabelle zu sein. Ein guter Ansatz, der aber wohl noch etwas Zeit und Mitarbeit zum Ausbauen braucht. Der Export in SVG hat auch nur ein unbefriedigendes Ergebnis gegeben. Das ganze SVG war von einer "Wolkenlinie" umrandet. Als Hindernis für weitere Mitarbeiter sehe ich auch, dass das Projekt nicht wirklich "frei" ist. Warten wir's ab. Selbst dann existiert noch kein Wörterbuch zum Durchblättern, wie ich es in Wikibooks habe.
Ich brauche noch 1 Jahr, um alle bisherigen Wörter zu überarbeiten. Die alten sehen so schrecklich hässlich aus. Ich habe jetzt auch ein schönes Programm gefunden, um alle Dateien in einem Rutsch in kleine PNG's zu konvertieren. "SVG Exodus zu PDF". Der Entwickler hat leider keine Zeit es an meine Sonderwünsche anzupassen, er hat mir geraten es selber zu tun. Seine Internetseite verweist auf den offenen Quellcode auf Github. Hast du für so was Zeit UND Kenntnisse? Die fertigen PNG's kann ich dann "relativ" schnell hintereinander aufreihen, um ein kompakteres Wörterbuch als PDF zu erstellen. Das Problem ist, dass ich in "SVG Exodus zu PDF" nur die HORIZONTALE Pixelauflösung per Hand einstellen kann. Meine SVG's haben aber oft eine variable Breite. Nur die Höhe ist für alle einheitlich. Ich müsste als in diesem Programm die Pixel-HÖHE für die auszugebenden PNG's einstellen können. Ansonsten müsste ich als workaount für hunderte bis tausende Konvertierungen die Pixelbreite jeweils individuell einstellen (mit einer Tabelle) - sonst haben die ausgegebenen PNG's einen unterschiedlichen Vergrößerungsfaktor und lassen sich somit nicht bruchlos mit den Linien aneinanderreihen. Vielleicht finde ich ja auch noch ein anderes SVG-Konvertierungsprogramm, das sich in der Pixelhöhe einstellen lässt.
Gruß --Thirunavukkarasye-Raveendran (talk) 15:06, 14 February 2021 (UTC)[reply]


Hinweis an Thirunavukkarasye-Raveendran: Ich habe den Stenogenerator noch nicht eingesetzt, wurde aber auf diesen aufmerksam gemacht. Der Autor sagt aus, die Symbolisierungen wären von ihm, unabhängig von dieser Sammlung entstanden, ein Verweis auf GitHub habe ich bisher nicht gesehen (15. Februrar; vielleicht liegt eine Verwechselung mit einem anderen Program vor, oder er änderte seine frühere Meinung). Neben dem kleinen sehe ich aber auch ein fast 60 MB grosses zusätzliches Wörterbuch als Ergänzung «Sie benö­tigen dieses Wörter­buch nur, wenn Sie oft lange Texte über­tragen.» Die Umwandlung der .svg in .png verstehe ich so, dass alle .png die gleiche Höhe haben sollen, mit dem gleichen Verhältnis Höhe:Breite wie im originalen .svg. Gut; welche Zielhöhe (in Pixeln) soll es sein? Typischerweise sollte für eine mögliche Ausgabe für den Drucker die Auflösung nicht kleiner als 300 dpi sein, also 300 Pixel per Zoll (2.54 cm). Zum Vergleich: Das unterscheidet sich deutlich von der Auflösung von (nicht-HD) PC-Bildschirmen mit nur 72 dpi. Und dann einmal über alle .svg mit dem Etikett «DEK» mit dieser einen Einstellung.--Pythonik (talk) 04:41, 15 February 2021 (UTC)[reply]

Mit ein paar typischen DEK .svg habe ich acht verschiedene Optionen probiert; zwei davon hier erscheinen mir besonders günstig weil wenig Speicherplatz / Bandbreite benötigt wird. Vorschlag: Ausprobieren, welche Option am besten für Deine Programme funktioniert und kurzes Echo in Hinblick auf Methode und Bildgrösse in ganzen Pixeln. Vorteilhaft wäre, wenn die .svg nochmals in einem Archiv zusammengefasst wären; diese einzeln von Wikimedia abzuholen ist möglich, dauert aber viel länger als nötig. Die fertigen .png könnte ich ähnlich extern ablegen.--Pythonik (talk) 11:54, 15 February 2021 (UTC)[reply]


@ Pythonik
Super Ansatz. PNG's mit gleicher Höhe! ABER
1. Das wird sich kaum jemand ausdrucken. Ein PDF mit 1.000 Seiten schaut man sich nur am PC an. Die Optimierung sollte also für PC erfolgen. Die Dateigröße spielt KEIN Rolle, die kann 10x so groß sein.
2. Die PNG's sind viel zu klein. Sie sind kaum am Bildschirm zu erkennen. Und wenn man reichscrollt zerpixeln sie sofort zur Unkenntlichkeit. Ich dachte so an 600 px Breite für die SVG's mit Standardbreite.
3. Ich arbeite mit "ABBYY FineReader PDF 15". Damit kann ich allerdings kein Stenowörterbuch erzeugen, weil jedes reingezogene PNG eine neue Seite erzeugt. Das beste und schnellste Ergebnis habe ich mit Windows Wordpad. Da kann ich mir die Bilder nacheinander reinziehen und sie kleben sofort ordentlich aneinander. Die so erzeugte rtf-Datei mit den Bildern ziehe ich dann ganz einfach in "ABBYY FineReader PDF 15" und habe mein PDF.
3a. Ein Probe-PDF mit deinen PNG's habe ich mal hochgeladen: Auf Github [1] (da kenne ich mich überhaupt nicht in der navigation aus) und noch mal auf Dropbox (wo auch alle svg als zip liegen, also der gleiche Link, wie hier ganz oben auf der Diskussionsseite) - #Datei-Download
4. Der Ausdruck der rtf-Datei zeigt noch mal, dass die PNG's zu kein sind. Besonders stört, dass die Linien verschwinden. Stenotext ohne eine Grundlinie macht nicht mal der Profi. Dummerweise habe ich alle seit 10 Monaten überarbeiteten Dateien mit etwas schwächeren Linien hochgeladen (grau statt schwarz) (Helligkeit 150 statt 38). Das rächt sich jetzt, kann ich aber nicht mehr alle nachträglich ändern.
5. Zum Hintergrund kann ich nichts sagen. Noch dazu ist mein Einstellungsfenster in Inkscape defekt, so dass ich das auch nicht ändern kann. Ich weiß nicht mal wie die aktuelle Einstellung für alle ist. ABER Dateigröße und Speicherplatz ist egal, wir müssen das nicht zum Mars hochbeamen.
6. Einen Unterschied zwischen den einzelnen Versionen sehe ich nicht, so lange wie sie so klein sein.
6a. Wenn sich die Auflösung unabhängig von der Seitengröße der PNG ändern lässt, dann sollt diese Auflösung hochgeschraubt werden, also lieber 300 als 72.
7. Wenn ich ganz fertig damit bin (1-2 Jahre), dann kommen die PNG's alle noch in eine separate Kategorie auf Commons. Aber jetzt noch nicht, sonst komme ich mit dem Management durcheinander, wenn ich später noch ergänzend hochladen will.
Toll dass du dich da ran setzt! Ich habe mir ein Klavier gekauft, fange damit frisch an und investiere deshalb etwas weniger Zeit hier für Steno, aber das schaffe ich noch.
Gruß --Thirunavukkarasye-Raveendran (talk) 18:08, 6 March 2021 (UTC)[reply]


@Thirunavukkarasye-Raveendran: Hier habe ich bearbeitete DEK Tafeln abgelegt (Grundlage ist Dein Archiv vom 31. Jänner). Die Mehrheit der .svg (32'134 von 32'587) hat mindestens eine hellgraue Linie gehabt, nicht nur die Grundlinie, stellenweise auch die anderen (etwa bei Aug., BGB, etc.). Weil diese aber -- im Vergleich zu den Zügen der Stenogramme -- deutlich schmaler sind, entschied ich mich, alle vier Linien einheitlich in schwarz zu halten. Auf Distanz betrachtet treten diese erfreulicherweise in den Hintergrund.

Probeweise grösser dimensionierte .png -- da ich noch nicht weiss, welche Variante «das Rennen macht», zunächst jeweils nur ein paar Dutzend -- liegen dort auch. Bevor die anderen Dateien zu .png verarbeitet werden, möchte ich noch Deinen Kommentar abwarten. Probeweise habe ich von einer Variante die bearbeiten Tafeln 1:1 auf ein A4-Blatt kopiert (eines der .pdf) und fand sie ein gross. Aber vielleicht schrumpfen die Dimensionen der .png noch weiter, wenn Du sie in das .pdf packst.

Es ist schade, die klaren Vektordarstellungen in ein Pixelformat zu bringen; vielleicht findet sich auch dafür noch ein programmatischer Ansatz dazu. Gruss --Pythonik (talk) 17:01, 8 March 2021 (UTC) .[reply]

@Pythonik : Wir sollte die Diskussion auf dort auf meiner Benutzerseite weiterführen. Auf Benutzerseiten löscht mir niemand was weg oder archiviert es in den Hintergrund. Thirunavukkarasye-Raveendran (talk) 21:54, 9 March 2021 (UTC)[reply]

LEERE Dateien

[edit]

Diese Dateien müssen gelöscht werden: (weil sie leer sind oder falsch sind oder Dubletten - für Ersatz mit richtigen Dateien ist bereits gesorgt)



--Thirunavukkarasye-Raveendran (talk) 18:46, 28 February 2022 (UTC)[reply]

Diskussions zum weitere Vorgehen

[edit]

@ User:Pythonik

Hi Phytonik, ich habe massenhaft noch Fehler in "meinen" Dateien. Es reicht wenn du einfach hier alle Dateien mit Fehlern aufzählst. Du brauchst die Fehler nicht näher beschreiben. Eine gewünschte zweite Version kannst du ja kurz beschreiben. Ich würde lieber systematisch vorgehen, da diese Fehler dann auch in anderen Worten mit dem gleichen Wortbestandteil auftauchen. Alle Dateien jünger als 12.5.2020 sollten keine Fehler mehr haben. Die anderen Dateien gehe ich noch mal systematisch durch, hauptsächlich um die Buchstabenformen zu korrigieren, dabei finde ich auch meist die Fehler.
Zahlreiche Dateien habe ich wieder gelöscht, meist handelt es sich um eine zweite Version (mit v2 am Ende des Dateinamens gekennzeichnet), die mir nun nicht mehr akzeptabel erscheint. Ich plane diese Dateien alle ganz am Schluss (in 1-2) Jahren von einem Admin ohne große Diskussion löschen zu lassen. Auch viele Dateien mit Rechtschreibfehlern im Namen sind LEER.
Mich würde Deine Meinung zum "L" interessieren! File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - l.svg. Momentan verwende ich für das normale "L" die Version b. Welche Version würdest Du vorschlagen? Vielleicht Version c? (gleiche Größe aber ohne Loch). --Thirunavukkarasye-Raveendran (talk) 14:53, 3 June 2020 (UTC)[reply]

@Thirunavukkarasye-Raveendran

Ich gehe davon aus, dass das Projekt noch einige Zeit brauchen wird und unter den 21146 am per Liste vom 30. Mai lokal geladenenen .svg noch stellenweise Wünsche auftreten werden. Angenommen, die heute gesehenen etwa 1k Einträge unter «A» sind genauso gut wie unter den Buchstaben [B-Z,a-z], dann wären Korrekturvorschläge wie heute (im unteren einstelligen Prozentbereich) meiner Meinung nach jedoch nicht hoch.
Zur Symbolisierung von L: ich befürworte die offene Form beim einfachen L (Muster b, obere Zeile in der von Dir angegebenen Vergleichstafel) wie bei «lesen», und die grössere aber gefüllte Form (Muster e) für das erste, verstärkte L etwa bei «Ballen». Vor dem Hintergrund, dass die Tafeln Lehrbeispiele sein soll(t)en, erinnert das deutlicher an den unterschiedlichen Druck beim Schreiben während der zirkulären Bewegung. In Analogie zur Schullangschrift werden die Ls auch hier mit Routine kleiner bis sich auch diese Öffnungen schliessen werden.
Es ist möglich, die .svg systematisch von WikiMedia abzuholen, und in eine Lernkartei wie etwa von Anki zu packen. In der Tat ist das auch eine meiner Motivationen, denn die dort bisher abgelegte Variante hier ist zwar umfangreicher als ein anderes Deck (hier), doch beide nutzen manchmal recht grobkörnige Bitmap .png. (Das setzt die Hürde, überhaupt einmal DEK zu lesen, manchmal höher, als nötig.) Auch deshalb scheint die redundante Auszeichnung der Ls vorteilhaft. Das gegenüber der DEK vergleichsweise geometrische Gregg wäre vermutlich nicht so leicht «zu verrauschen».--Pythonik (talk) 16:28, 3 June 2020 (UTC)[reply]

@ User:Pythonik

OK, also "L" Version b. Dann muss ich also nichts ändern. Mein nächstes Problem ist File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - nd.svg - Ich bin mit meiner Version k (die ich überall bei meiner Überarbeitung einsetze und auch schon vorher meist verwendet habe) NICHT wirklich zufrieden. Mein "nd" sieht zwar nicht so schrecklich aus, aber es weicht doch sehr stark von den Lehrbüchern ab. Aber es kommt immer wieder diese Form raus (grün-rot), wenn ich das "n" und "d" (Markierungsbuchstabe e) aus meinem Setzkasten zusammensetze. Vielleicht wäre Version h besser? Vielleicht kannst du ja ein handgezeichnetes Bild mit "nd" hochladen, damit ich eine Schablone als Vorlage habe (vielleicht meine Vorschläge ausdrucken und per Hand korrigieren, ein einfaches Handyfoto reicht mir).
Dateinamen der LEEREN Dateien bitte hier in einem separaten Abschnitt sammeln, damit sie später mal in einem Rutsch gelöscht werden können und damit ich die gleichen Dateien lösche, die lokal auf meinem Rechner sind. --Thirunavukkarasye-Raveendran (talk) 18:37, 4 June 2020 (UTC)[reply]

@Thirunavukkarasye-Raveendran

Re "nd" denke ich darüber nach. Bisher fand ich aber die eingesetzte Form gut lesbar.--Pythonik (talk) 18:27, 6 June 2020 (UTC)[reply]

@Thirunavukkarasye-Raveendran

Re Die gegenwärtige Sammlung enthält mehrere Dutzend Namen, etwa mit vorangestelltem string «Herr_», oder «Frau_». Zumindest mir sind einige Namen komplett unbekannt, und lassen sich auch nicht in der deutsch- oder englischsprachigen Wikipedia finden. Wie wäre es, zukünftig nur Namen mit einem Artikel aus dieser Quelle zu entnehmen? Das hätte auch einen größeren Wiedererkennungseffekt der Symbolisierungen im Alltag zur Folge.--Pythonik (talk) 12:31, 10 June 2020 (UTC)[reply]
Weitere Namen habe ich auch nicht geplant. In letzter Zeit habe ich auch Namen aus der WP genommen - meist aber recht unbekannte. Bei den Familiennamen geht es teilweise um vertrackte Buchstabenkombinationen zu denen ich mir dann einfach einen gängigen Vornamen ausgedacht habe. --Thirunavukkarasye-Raveendran (talk) 09:10, 11 June 2020 (UTC)[reply]

@Phytonik

Ich schlage vor, dass die bisherigen (ca. 22.000) Dateien alle in eine andere Kategorie verschoben werden. Ich bräuchte dein Meinung und dein OK dazu, bevor das jemand für uns erledigt, denn ohne Diskussion läuft in der Wikipedia-family nun mal nichts. Also: Gegenwärtig sind alle Dateien in der "Category:SVG Deutsche Einheitskurzschrift" (den Kategorienamen hatte ich mir ausgedacht). Nun sind aber alle Dateien eigentlich nur eine Teilmenge davon, nämlich "Verkehrsschrift". Nun haben wir aber noch die "Schnellschrift“ (gegliedert in „Eilschrift“ und „Redeschrift“). Deshalb schlage ich vor drei neue Kategorien als Unterkategorie von "Category:SVG Deutsche Einheitskurzschrift" anzulegen:
"Category:SVG Deutsche Einheitskurzschrift - Verkehrsschrift"
"Category:SVG Deutsche Einheitskurzschrift - Eilschrift" - (Vielleicht legt ja irgendwer mal einige Dateien dazu an.)
"Category:SVG Deutsche Einheitskurzschrift - Redeschrift"
Zu überlegen wäre, ob man sich an die offizielle Untergliederung der "Deutsche Einheitskurzschrift" hält und und neben der Verkehrsschrift noch die Kategorie "Schnellschrift" anlegt - und erst darunter die Kategorien "Eilschrift" und "Redeschrift". Ich persönlich finde eine separate Kategorie "Pythonik" für überflüssig und lästig, da das nur die Tiefe des Kategoriebaumes sinnlos erhöht und keine Dateien in der Kategorie "Schnellschrift" denkbar sind. Eigentlich müssen wir diese Teilfrage jetzt gar nicht lösen, da jetzt noch keine Dateien in den Kategorien "Eilschrift" und "Redeschrift" vorliegen.
Außerdem sollten wir noch überlegen, ob es vielleicht einen passenderen Kategorienamen für "Category:SVG Deutsche Einheitskurzschrift" und "Category:SVG Deutsche Einheitskurzschrift - Verkehrsschrift" gibt. Vielleicht irgendwas englisches, wie in Commons üblich. Mir fällt aber nichts kluges dazu ein. Vielleicht sollte man dazu (für einen schönen Kategorienamen) einen Admin hinzuziehen. --Thirunavukkarasye-Raveendran (talk) 19:05, 28 June 2020 (UTC)[reply]

@Thirunavukkarasye-Raveendran

Diskussionsvorschlag: DEK_VS_steno

Ausgehend von den Dateien hier auf wikimedia habe ich abgewandelte Dateien im Gebrauch, unter anderem auch zum Durchmustern nach Leserlichkeit wie hier. Diese separat aufbewahrten Nicht-Originale habe ich im Muster von «DEK_VS_steno_svg_-_Zypresse.svg» umbennannt, und fand bis jetzt im ersten Teil des Dateinamens vor dem Bindestrich alle Information, um sie rasch als solche wiedererkennen zu könnnen. «steno» is kurz und knapp das Thema; selbst für viele, die keine Kurzschrift anwenden oder lern(t)en, ist klar, dass es für «Stenographie» steht, lautlich auch in anderen Sprachen erkennbar. Mit «DEK» ist es schon spezieller, läßt aber Platz für andere Systeme (Stolze, Gregg, etc). «VS» für «Verkehrsschrift» ist mir griffig genug, ließe aber auch «ES» und «RS» für die Eil- und Redeschrift frei, ohne daß die einzelnen Dateinamen zu lang werden. Die Beobachtung für mich nämlich war, daß ein paar der Rohdateien von einer Bearbeitung (und damit auch der späteren Durchmusterung) ausgeschlossen werden mußten weil die Dateinamen für das Dateisystem zu lang waren. Einerseits ist es nun mal Deutsch (Bär, Töff, übrig), andererseits ist die Ablage in Linux in UTF-8 (die ich später auch wieder brauche) etwas speicherhungriger als ASCII-7bit. Deshalb, in Summe, mein momentaner Vorschlag für eine kurze Kategorie.--Pythonik (talk) 18:11, 2 July 2020 (UTC)[reply]

Von Rede- wie auch Eilschrift habe ich mich bisher ferngehalten. Deshalb aber eine neue Decke einzuziehen, «2. Teil: Schnellschrift, A. Eilschrift» und «2. Teil, B. Redeschrift» wie im Erbach(*) bringt meiner bisherigen Auffassung nach keinen wirklichen Nutzen hier. Ein Triplet von Verkehrschrift, Eilschrift, Redeschrift -- gleichberechtigt auf einer Ebene -- genügt. Wer schon Interesse an Stenographie überhaupt hat, findet rasch die Information, daß sie aufeinander aufbauen (hier im Sinne von «weglassen»). Eine Unterscheidung der drei sollte sodann sowohl in der Kategorie (VS, ES, RS), als auch im Dateinamen stattfinden. Letzteres hätte sogar den möglichen didaktischen Vorteil, Tafeln zu einem Wort in den drei Versinnbildlichungen nebeneinander einfacher zu vergleichen. Ganz wie im Taschenwörterbuch die drei auch nebeneinander stehen.

(*)Handbuch der Deutschen Einheitskurzschrift, Winklers Verlag 1983. Bis Seite 132 (einschließlich) zur Verkehrsschrift. Erst dann Schnellschrift und ab S. 217 zur Redeschrift.--Pythonik (talk) 18:11, 2 July 2020 (UTC) --Pythonik (talk) 18:11, 2 July 2020 (UTC)[reply]


Thema Dateinamen

@Pythonik Ich verstehe nur die Hälfte - spätestens ab UTF-8...

Erst mal zu den Dingen, zu denen wir uns einigen können. 3 Unterkategorien, ohne eine zwischengeschaltete Kategorie "Schnellschrift" (Die Kategorie könnte man sogar auch später noch mit wenigen Handgriffen einfügen). Nicht genau verstehe ich deinen Vorschlag zu den Kategorienamen: Geht Category:SVG Deutsche Einheitskurzschrift - Verkehrsschrift, Category:SVG Deutsche Einheitskurzschrift - Eilschrift und Category:SVG Deutsche Einheitskurzschrift - Redeschrift für dich in Ordnung?

Antwort: Ja, mit diesem Muster für Wikimedia bin ich einverstanden, denn es erlaubt einen zukünftigen Ausbau auf alle drei Stufen. Mit Ausnahme "ö" für "Österreich" verstehe ich von DEK's Eilschrift und Redeschrift jedoch (noch) nichts.

Große Probleme habe ich wegen der von dir vorgeschlagenen kürzeren Form der Dateinamen.
a) weil das bedeuten würde die bisherigen 22.000 Dateinamen zu ändern. Wenn ich mal einen Dateinamen ändere (ich habe nur Rechte zur Namensänderung), dann dauert das fast 30 Sekunden. Man könnte jemanden mit einem Bot dransetzen, aber ich habe mal vor vielen Jahren gehört, dass ein Bot nicht unbeaufsichtigt laufen soll und auch keine Änderungen im Hochfrequenztakt durchführen soll (maximal 10 Änderungen je Minute?). Ich weiß nicht mal wie lange die Kategorieverschiebungen der Dateien (ohne Namensänderung) dauern wird.

Antwort: Die (für mich) verkürzten / umgestalteten Dateinamen nutze ich für Dateien, die von Deinen hier auf Wikimedia abgeleitet sind, für eine Sammlung von Lernkarten (hier). In diesem, von WikiMedia dann unabhängigen Rahmen, war die anfängliche Umbennung vorteilhaft (für die 21221 Dateien vom Mai brauchte es lokal auch etwa 48 s). Denn es hat schon ähnliche Sammlungen (kleinere Sammlung, größere Sammlung, mit Deinen Dateien), die mit den "Maikarten" inhaltlich überlappen und die ich auch gemeinsam zur Übung einsetze. Da die von Deinen Dateien abgeleiteten Dateien innerlich verändert worden sind, sah ich davon ab, sie in die WikiMedia zurückfließen zu lassen.

b) Die Abkürzungen VS, ES, RS im Dateinamen würde diesen sehr kryptisch machen. Das direkte Auffinden eines Wortes ist fast unmöglich bei 22.000 Dateien in einer Kategorie. Meist erhalte ich einen Treffer, wenn ich nach "DEK Bockwürste" suche ("Bockwürste" steht hier für das gesuchte Wort).
File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwürste.svg (das wäre mein Namensfavorit)
File:DEK Deutsche Einheitskurzschrift - VS - Bockwürste.svg
File:Deutsche Einheitskurzschrift - VS - Bockwürste.svg
File:Steno - Verkehrsschrift - Bockwürste.svg

Antwort: Mit Abstand und für den typischen Nutzer auf WikiMedia gesehen, einverstanden. Kein VS, ES, oder RS und das erste Muster (File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwürste.svg) für die Dateien hier auf WikiMedia.

Die Länge der Dateinamen ist begrenzt, aber ich denke, dass in Windows (ich habe keine Ahnung von Linux) die maximale Namenslänge noch nicht ausgereizt ist:
File:Z DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Das Dreigestirn Eiger, Mönch und Jungfrau liegt im Berner Oberland.svg
File:Z DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Der Potsdamer Postkutscher putzt den Potsdamer Postkutschkasten - Den Potsdamer Postkutschkasten putzt der Potsdamer Postkutscher.svg
File:Z DEK Deutsche Einheitskurzschrift - Verkehrsschrift - auf be- das dem den der deutsch die er er- es für gegen hat ich in ist kann nicht ohne sind so und ver- vom von vor- wo über.svg
File:Z DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Arbeitsgemeinschaft der öffentlich-rechtlichen Rundfunkanstalten der Bundesrepublik Deutschland.svg

Antwort: Für die Weiterverarbeitung außerhalb von WikiMedia hatte ich mit Dateien wie File:Z DEK Deutsche Einheitskurzschrift - Verkehrsschrift - auf be- das dem den der deutsch die er er- es für gegen hat ich in ist kann nicht ohne sind so und ver- vom von vor- wo über.svg mit Linux etwa beim Abspeichern Probleme. Das hängt damit zusammen, wie das Betriebssystem Zeichen und Umlaute als Nullen und Einsen abspeichert (Richard Jelineks Antwort). Da ich meine Skripte hier überhaupt erst einmal zum Laufen bringen wollte, wählte ich Linux. Windows arbeitet in dieser Hinsicht anders und erlaubt mehr Zeichen im Dateinamen, als Linux. Kurz: für die Daten hier nicht relevant.

Ich denke, wenn wir eine maximale Länge der Dateinamen wollen, dann sollten wir uns verständigen ab welcher Länge ich hinten abschneiden soll.

Antwort: Die erwähnte Beschränkung mit längeren Dateinamen wie File:Z DEK Deutsche Einheitskurzschrift - Verkehrsschrift - auf be- das dem den der deutsch die er er- es für gegen hat ich in ist kann nicht ohne sind so und ver- vom von vor- wo über.svg ist in Linux niedriger, als in Windows. Die durch Versuch und Irrtum für die (nur bei mir lokal veränderten) Dateien gefundene Grenze von 70 Zeichen (gezählt ohne die Endung ".svg" sowie ohne die ursprüngliche Kennung "(Z )DEK Deutsche Einheitskurzschrift - Verkehrsschrift - ") -- gut genug identifiziert um dem Speicherproblem aus dem Weg zu gehen -- tangiert augenscheinlich nur meine Weiterverabeitungen der Tafeln hin zu einem Ankistapel unter Linux. Also für die Daten hier nicht relevant.

Das Auffinden der Dateien ist nur vernünftig über ein "stenografisches Wörterbuch" auf Wikibooks zu realisieren. Das ist mit vertretbarem Aufwand machbar. Ich habe das vor Monaten mal probeweise gemacht: de:b:Benutzer:Thirunavukkarasye-Raveendran/Stenografisch Wörterbuch, das kann man auch einfach mit thumbnails ergänzen. Ist aber noch verfrüht, da ständig neue Wörter dazukommen. An eine Ergänzung mit ES und RS mag ich noch gar nicht denken, dazu reicht meine Kraft nicht mehr. Gruß --Thirunavukkarasye-Raveendran (talk) 19:24, 2 July 2020 (UTC)[reply]

Antwort: Schon die Unternehmung "Verkehrsschrift" allein zu stemmen, ist so umfangreich, daß ich vermutete, wenigstens einige der Deiner Symbolisierungen würden programmatisch (vergleichsweise zu Herrn Sarmans txt2DEK) erstellt und nicht ausschließlich glyphenweise aus den Setzkästen manuell gefügt. Auch weil manche der bisher vorgeschlagenen Änderungen sehr rasch auch bei von mir noch nicht angesprochenen Tafeln zu sehen waren. Auch (besser: auch noch) ES und RS zu berücksichtigen wúrde eine mehrköpfige Redaktion benötigen, die es momentan aber nicht hat.

c) Ich habe noch mal drüber geschlafen. Ich muss mein Veto gegen die Umbenennung der bisherigen DEK-Dateien einlegen, denn das würde mich momentan aus dem ganzen Projekt rauswerfen. Mein jetzige Arbeit kann ich nur machen, weil ich die Dateien lokal auf meinem PC habe. Die Dateien auf Commons sind praktisch nur ein Spiegel meiner lokalen Dateien. Wenn meine Arbeit in ca. 4 Jahren abgeschlossen ist, habe ich auch nicht gegen eine Umbenennung. Aber bis das "Stenografische Wörterbuch" auf Wikibooks fertig ist, müssen die Dateinamen so bleiben. Außerdem würde eine Dateiumbenennung mein anderes unfertiges Projekt zerstören, an dem ich schon seit Monaten arbeite und noch mehrere Monate brauche: es:b:Curso de alemán para avanzados con audio/Lección 015e.

Antwort: Wie bereits beschrieben, befürworte ich das von Dir vorgeschlagene Muster von (File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwürste.svg) für Deine hier hinterlegten / gespiegelten Dateien. In das Wikibook hatte ich noch nicht geschaut.

Ganz oben auf der Diskussionsseite werde ich versuchen meine SVG-Dateien als zip zum Download anzubieten. Ich komme aber noch nicht gut zurecht mit Dropbox. --Thirunavukkarasye-Raveendran (talk) 07:09, 3 July 2020 (UTC)[reply]

Antwort: Danke.--Pythonik (talk) 12:50, 6 July 2020 (UTC)[reply]

Ich setze nicht mehr alle Worte aus dem Setzkasten zusammen. Momentan überarbeite ich ab dem 12.5.2020 alle Dateien noch einmal, weil ich doch im Laufe der zeit dazugelernt habe und die alten Dateien teilweise recht hässlich sind. Alle Dateien jünger als 11.4.2020 sind also für mich in ihrer entgültigen akzeptablen Version. Da hat man schnell einen Wortstamm zusammen, den man schnell kombinieren kann. Interessant wird es erst ganze längere Texte mit dem Wörterbuch zusammenzustellen. --Thirunavukkarasye-Raveendran (talk) 19:46, 6 July 2020 (UTC)[reply]

Ich habe mal eine Voranfrage wegen Dateiverschiebung gemacht: Commons:Bots/Work_requests#Feasibility_inquiry. Das ginge aber nur, wenn mir jemand meine lokalen Dateien auf meinem PC umbenennen kann. Ich kann es nicht. Soll ja mit entsprechenden Programmen machbar sein. --Thirunavukkarasye-Raveendran (talk) 16:30, 18 July 2020 (UTC)[reply]

Dort hat man mich an User talk:CommonsDelinker/commands verwiesen. --Thirunavukkarasye-Raveendran (talk) 08:24, 19 July 2020 (UTC)[reply]

Löschvoranmeldung

[edit]

@Thirunavukkarasye-Raveendran

Vorschlag: Ich plane, bis 11. Juli für die hier benannten korrigierten und neuen Symbolisierungen einen programmatischen Weg gefunden zu haben, sie in mein abgeleitetes Projekt auf GitHub einzupflegen. Für einen erfolgreichem Probelauf wäre es für (für mich) vorteilhaft, blieben die Einträge hier noch als Merkzettel stehen. Nach Signalisation + etwa 24 h später würde ich die bisherigen Verweise löschen um die Seite für die nächste Iteration wieder übersichtlicher zu haben.Pythonik (talk) 20:15, 6 July 2020 (UTC)[reply]

Ich verstehe wieder mal nur die Hälfte. Aber ich werde nichts löschen. Du meinst sicherlich die Liste der zum Löschen vorgesehenen LEEREN-Dateien. Kannst du etwas programmieren - String-Manipulation? Das würde die Anfertigung eines Wörterbuches auf Wikibooks sehr erleichtern. Durch einige automatisierte Bearbeitungen in einer Tabellenkalkulation habe ich es geschafft (nachdem ich die Namen der Dateien aus dem Explorer extrahiert habe) sie in das Format für die Dateidarstellung "[[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwürste.svg|thumb|Bockwürste]]" umzuwandeln. Nun muss aber noch einer Tabellenstruktur für das Wörterbuch erzeugt werden, was sich sicherlich relativ einfach programmieren ließe.


 |-
 | [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwürste.svg|thumb|Bockwürste]]
 || [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwurst.svg|thumb|Bockwurst]]
 || [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Wurst.svg|thumb|Wurst]]

Die 23.000 Dateien müssen in dieses Format gepresst werden. Ich veranschlage 2 Wochen dafür wenn es mit primitiver Handarbeit gemacht wird. Deshalb plane ich auch erst am Ende des Projektes das Wörterbuch zu erstellen. Den Entwurf zum Wörterbuch hatte ich schon vor 10 Monaten erstellt, damals mit knapp 10.000 Wörtern, um einen Überblick über die Datenmengen je Seite zu bekommen. Ach ja, vorher müssten noch die Versionsnummern umsortiert werden, da der Windows Explorer seine Logik beim Sortieren hat (Foo v2, Foo v3, Foo v4, Foo). Mit Handarbeit könnte das auch noch mal eine Woche dauern. --Thirunavukkarasye-Raveendran (talk) 17:40, 9 July 2020 (UTC)[reply]

was könnte das bedeuten? 01; was könnte das bedeuten? 02?


@Thirunavukkarasye-Raveendran Basierend auf dem Archiv vom 20. Juli, habe ich die Frage korrekt verstanden, dass es eine Liste braucht, in der die .svg nach dem Muster "[[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwürste.svg|thumb|Bockwürste]]" aufgeführt werden? Falls ja, habe ich unter hier eine etwa 2 MB große Textdatei zur freien Verfügung abgelegt.--Pythonik (talk) 14:43, 27 July 2020 (UTC)[reply]

Antwort: Das sieht doch schon sehr gut aus: de:b:Benutzer:Thirunavukkarasye-Raveendran/Stenografisch Wörterbuch/Wortliste mit Link - Teil 1 und b:de:Benutzer:Thirunavukkarasye-Raveendran/Stenografisch Wörterbuch/Wortliste mit Link - Teil 2 --Thirunavukkarasye-Raveendran (talk) 09:29, 29 July 2020 (UTC)[reply]
2. Wunsch: Die Liste der Dateien - aber ohne den vorderen Teil (alles vorne muss weg - bis einschließlich "|thumb|"), so dass es nur eine Vokabelliste OHNE Link ist (die hinteren schließenden brackets können auch weg). Dann ergibt sich so was. Die Liste ist klein genug um auf eine Browserseite zu passen und lässt sich schön nach irgendwelchen Wortbestandteilen oder Buchstabenkombinationen durchsuchen.
KORREKTUR: Zuerst muss die Liste vorher alphabetisch sortiert werden. Momentan ist sie so sortiert, dass erst die Großbuchstaben A-Z und dann erst die Kleinbuchstaben a-z sortiert sind. Beides mus aber ineinandersortiert werden. Das hab ich mit Libre-Calc gemacht (als UTF-8 einfügen; Daten - Sortieren - Optionen - "Groß- und Kleinschreibung"). Die habe das in der Datei "DEK_Tabelle_2020-07-20 gross klein sortiert.txt" erledigt und bei mir auf Drop-Box abgelegt und auf google.--Thirunavukkarasye-Raveendran (talk) 06:54, 30 July 2020 (UTC)[reply]
KORREKTUR berücksichtigt: Das dazugehörige Skript habe ich insofern angepaßt, daß Groß- und Kleinschreibung bei der Sortierung nun irrelvant ist. Die neue Version der Liste, egal ob später gebraucht, oder nicht, steht an gleicher Anschrift. Sie ersetzt die frühere Version. Wieder etwas gelernt.--Pythonik (talk) 10:23, 31 July 2020 (UTC)[reply]
3. Wunsch: Die Liste wie momentan auf Git-Hub aber nach jeder 3. Zeile ein zusätzliche Zeile mit "|-" und vor jeder Zeile mit Datei ein "||", allerdings vor jeder ersten Zeile des Viererblockt nur ein "|". So wie im folgenden Beispiel. Das bekomme ich mit Libre Calc nicht hin. Ginge auch mit Calc, wenn ich auf die Formel für die Folge 1,2,3, 5,6,7, 9,10,11, 12,13,14, 15,16,17 ... käme (schaffe ich aber nicht) - wahrscheinlich ihrgendwas mit Modulo drin. x+(x/3)+x%3, so was in die Richtung. [2]. -Jetzt habe ich es: Die Formel in LibreCalc muss lauten = A1 + GANZZAHL ( (A1 - 1) / 3). Wobei in Spalte A einfach die fortlaufenden Zahlen stehen. In Spalte B steht die Formel, womit eine Zahlenreihe mit periodischen Lücken erzeugt wird. Darunter steht eine Zahlenreihe, die nur aus diesen Lückenzahlen besteht, in Spalte C stehen die alphabetisch sortierten Dateinamen (ohne Berücksichtigung von. Groß- und Kleinschreibung.) Abschließend werden Spalte B und C sortiert, wobei Spalte B der Schlüssel ist.
KORREKTUR: siehe 2.
Ich glaube ich habe einen Weg gefunden mit Libre Calc und etwas Arbeit die Dateien in 1-2 Arbeitstagen wie gewünscht zu bearbeiten.
KORREKTUR berücksichtigt: Nach gleicher Prämisse wie für Wunsch #2 (Groß- und Kleinschreibung) wurde auch hier das Skript geändert. Die neue Gruppenliste ersetzt die frühere, erreichbar am gleichen Ort wie zuvor.--Pythonik (talk) 10:23, 31 July 2020 (UTC)[reply]


@Thirunavukkarasye-Raveendran

Wenn es darum geht, die Dateinamen (nicht bloß die Listen) umzuschreiben hat mir in der Vergangenheit das Programm antrenamer viel Zeit erspart: Quelle bei chip.de (mit Installation im Windows-System), oder Quelle ohne Installation (etwa auf einem USB-stick mitnehmbar). Trotz gewissem Alter (Version 2.12.0 von 2015) ist nach kurzer Einarbeitung die Veränderung von Dateinamen auch von vielen Dateien zügig absolviert, insbesondere bei (wie hier) wiederkehrenden Mustern, die zu verändern sind. Schriftlich: (kurze Vorstellung), oder als ein Video beispielsweise auf youtube.--Pythonik (talk) 20:40, 30 July 2020 (UTC)[reply]


 | [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwürste.svg|thumb|Bockwürste]]
 || [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Bockwurst.svg|thumb|Bockwurst]]
 || [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Wurst.svg|thumb|Wurst]]
 |-
 | [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Xaver.svg|thumb|Bockwürste]]
 || [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Yacht.svg|thumb|Bockwurst]]
 || [[File:DEK Deutsche Einheitskurzschrift - Verkehrsschrift - Zündkerze.svg|thumb|Wurst]]
 |-
 ...

In 6 Tagen setzte ich mich wieder intensiv an die Steno-Dateien. --Thirunavukkarasye-Raveendran (talk) 10:38, 29 July 2020 (UTC)[reply]

@Thirunavukkarasye-Raveendran

Die einfache Wortliste (Wunsch #2) habe ich hier abgelegt. Der Einzeiler trennt die Einträge mit Komma und schließt mit Punkt.

Die gruppierte Listung der .svg (Wunsch #3) befindet sich hier. In der «letzten Gruppe» steht bislang jedoch nur ein Eintrag und die anderen Zeilen fehlen; deshalb braucht es dort manuelle Korrektur.--Pythonik (talk) 08:54, 30 July 2020 (UTC)[reply]

Vielen, vielen Dank! Ich habe das "Stenografische Wörterbuch" jetzt online: b:de:Stenografisches Wörterbuch. --Thirunavukkarasye-Raveendran (talk) 09:46, 31 July 2020 (UTC)[reply]

@Thirunavukkarasye-Raveendran Mein erster Eindruck vom Wörterbuch ist «sehr klar, leicht und deutlich zugänglich». Insbesondere mit dem Limit auf drei Spalten je Beispielzeile hat es für das Auge eine angenehme Balance, Gemeinsamkeiten und Unterschiede mit den benachbarten Tafeln zu erkennen. In Format (im Sinne von wiedergegebener Größe) und Klarheit der Wiedergabe -- sowohl in Hinblick auf Linienzüge und -verstärkung, als auch die Hilfslinien die tatsächlich im Hintergrund bleiben.--Pythonik (talk) 10:43, 31 July 2020 (UTC)[reply]

@Thirunavukkarasye-Raveendran Falls für die Aktualisierung des Stenographischen Wörterbuches habe ich, basierend auf den Archiven auf GoogleDrive die beiden einfacheren Listungen der Dateien wie auch die gruppierte Liste aktualisiert (https://github.com/nbehrnd/dek_wikimedia). Das betrifft sowohl das Archiv vom 2. August, als auch das neuere vom 29. August. Im Gegensatz zur früherern Form im Juli hat es bei der Liste mit Hinweis auf das Vorschaubild in jeder Zeile die führende Raute.--Pythonik (talk) 15:47, 31 August 2020 (UTC)[reply]

Vielen Danke! Ich schaue mal, wann ich das Stenografische Wörterbuch aktualisiere. Seit 3 Wochen kann ich (augenblicklich) nicht mehr die Dateinamen für eine Listenaufstellung extrahieren. Aber wenn du mir das aufbereitest ist es natürlich komfortabler. Voraussichtlich dauert es noch 10 Monate bis ich alles noch mal durchgeschaut habe. Ich habe auch noch einige Fehler gefunden. Voraussichtlich werde ich am 1.11.20 oder so ein neues Archiv hochladen. --Thirunavukkarasye-Raveendran (talk) 11:01, 9 September 2020 (UTC)[reply]
@Thirunavukkarasye-Raveendran Nach erneutem Nachdenken über die «drei hilfreichen Listen» habe ich einen alternativen Weg gefunden, diese zu schreiben. Dieser nutzt aus, dass die Anschriften von Wikimedia Dateien auch listenweise erhältlich sind; also hier die simultane Verschlagwortung mit «SVG» und «Deutsche Einheitskurzschrift». Für diese Operation ist es auch ncht nötig, erst alle .svg tatsächlich von den Servern herunterzuladen, eine doch erhebliche Ersparnis in Bandbreite und Zeit für (momentan berücksichtigte) 25900 .svg. Um sie für mich einfacher zu organisieren hat es im Kopf der Datei stets paar Zeilen zu Dateinamen, dem Datum der Erstellung, und wieviele Dateien beim Prozessieren berücksichtigt worden sind; alles ab und einschliesslich Zeile 5 ist dann die eigentliche Liste. Nämlich, die Nennung der Namen (ohne .svg Endung), die einfache Vorschautabelle, sowie die 3er-Gruppen Vorschau. Die Formatierung der Resultate behält die Muster des bisherigen Vorgehens (erst alle .svg einsammeln, dann analysiseren, sodann die Listen schreiben lassen) und lässt sich nun einfacher (auch: öfter) wiederholen, als bisher.
Punkt 1, bitte Obacht: Weil einige der Dateien mehrere Versinnbildlichungen enthalten, und deshalb bereits im Dateinamen ein Komma beinhalten, nutzt die Wortliste nun das Semikolon als Trenner zwischen den Einträgen. Das Laden der Datei kann je nach Programm schon etwas dauern, eine Zeile mit 25900 Einträgen ist ja auch nicht «ohne».
Punkt 2, momentan kein Problem (auch weil Umweg gefunden): Es sieht so aus, als ob die originalen Dateinnamen Leerzeichen enthalten haben, wenn mehr als ein Wort symbolisiert wurde. In Wikimedias Downloadanschriften sind diese durch Unterstriche ersetzt worden. In den drei Listen sind diese Austausche wieder rückgängig gemacht worden. Langfristig ist die Arbeit mit Dateien aber einfacher, wenn in den Dateinamen keine Leerzeichen auftauchen.--Pythonik (talk) 19:05, 10 September 2020 (UTC)[reply]
@Pythonik
Ein Dateiname ohne Leerzeichen kann ich mir nicht vorstellen. Momentan finde ich die meisten Wörter auf Commons, indem ich einfach ein "dek" voranstelle: "dek Automat". So habe ich eine Trefferrate von 99% - und die Datei wird mir sofort als erste vorgeschlagene Datei angeboten. Mit "File:Automat.svg" oder "File:wir.svg" bekomme ich meine Stenozeichnung nicht immer angezeigt. Solche kurzen Dateinamen sind oft schon besetzt auf Commons. Es müsste also mindestens ein "DEKVK" davor stehen. "DEKVK Bockwürste" wäre noch gut zu finden, aber nicht mehr selbsterklärend und würde schon ein Leerzeichen enthalten. Weiterhin gibt es viele Dateinamen mit "ABER": "sein ABER seine" und dann gibt es noch viel Redewendungen, die ich momentan alle umsortieren (mit einem "Z" vor dem "DEK", damit sie am Ende der Datei stehen; bzw. "X" für Buchstabenlisten und "Y" für konjugierte Verblisten). Ich bin mit jedem praktikablen Vorschlag einverstanden, so lange DU mir die Dateien auf deinem Rechner umbenennst und mir zurück schickst. Für die Umbenennung auf Commons finde ich schon jemanden - der hat dann 3 Tage Arbeit damit, weswegen wir eine Umbenennung nicht erst in 4 Jahren, sondern lieber jetzt realisieren sollten. (Wenn ich in einem Jahr mit der 2. Durchsicht durch bin, dann habe ich so viele Wortbausteine, dass ich schneller werde - ich will dann noch sehr viel Vokabular ergänzen.)
Allerdings verstehe ich das ganze Grundproblem nicht. So lange niemand sonst Dateien anlegt habe ich den kompletten Datensatz auf meinem Rechner. Bisher hatte ich einen Weg, um die Dateinamen in eine Liste zu übertragen (habe ich mir mal dort notiert: [3]. Seit meinem letzten Windows10 Update geht es aber nicht mehr. Wenn ich etwas suche sollte ich es aber wieder hinbekommen. (Jetzt springt nicht mehr die DOS-Shell auf, sondern die Windows-"Shell". Ich kann zwar separat in die DOS-Shell, bin da aber momentan zu doof, um im Dateibaum zu navigieren: cd dir ?=)&/)=PZ? Aber das schaue ich mir mal an und dann klappt das. Das Stenografische Wörterbuch muss ja nicht so oft aktualisiert werden. Ich kenne nur den Windows Explorer, aber ich stelle mir vor, dass das Extrahieren der Dateinamen mit Norton Commander oder ähnlichen auch komfortabel möglich ist.)
Mein langfristiger Plan ist ein ganz anderer. Texte in Steno (Autopgraphen) sind im Internat praktisch nicht vorhanden und schon gar nicht frei (im Vergleich zu Pornoseiten). Das wollte ich abstellen, indem ich erst mal ein Wörterbuch anlege und dann damit Texte verfasse. Jetzt ist ein Programmierer gefragt: Es müsste doch möglich sein automatisch SVG-Dateien als Arbeitshilfe zu erzeugen. Beispiel: Gegeben ist ein Satz aus 10 Wörtern. Das Programm sucht dazu aus den 30.000 SVG-Dateien die passenden Dateien raus und erstellt eine eigene SVG-Datei, in die diese 10 SVG-Bilder reinkopiert werden. Da die Ausrichtung in der neuen Datei sehr problematisch wäre, würde es reichen, wenn diese 10 Bilder mit ausreichend Sicherheitsabstand alle untereinander in der zu erstellenden SVG-Datei stehen. Das wäre eine unheimliche Arbeitserleichterung beim Erstellen von längeren Steno-Texten. Ich meine richtig lange Steno-Texte. Das Gute ist, daß alle meine bisherigen DEK-Dateine die Grundlinien streng getrennt in einer Ebene haben (die brauchen wir nicht) und die Stenozeichen in einer separaten Ebene. Es gibt nie eine dritte Ebene. Wenn das machbar wäre, das wäre toll. Natürlich würden dann viele Wörter noch einen Fehltreffer ergeben, die könnte man dann ja als rotes Viereck oder als Text in die zu erstellende SVG-Datei ausgeben.
Welcher Text würde dir vorschweben? "Die Leiden des jungen Werther" habe ich wieder verworfen, zu viele exotische und alte Wörter außerhalb meines Wörterbuches. Max und Moritz? Faust? Die Buddenbrooks (Mein Favorit, Thomas Mann 1955 gest., da sollte in 5 Jahren das Copyright ablaufen)? Gothes Liebesbriefe? Ein Exzellenter Artikel aus der Wikipedia? Irgendeine unbekanntere Erzählung? --Thirunavukkarasye-Raveendran (talk) 18:41, 11 September 2020 (UTC)[reply]


@Thirunavukkarasye-Raveendran

Zum Punkt «Leerzeichen in den Dateinamen»: Deine .svg verarbeite ich von Zeit zu Zeit weiter, und wegen ihrer Veränderung gab es keinen Anlass, sie hier unter die ursprünglichen zu mischen. Während der Verarbeitung, lokal auf meinem Rechner, hatten sich anfänglich meine Programmskripte manchmal «verschluckt», wenn im Dateinamen ein Leerzeichen auftauchte. Nach Anpassung (i.e. jetzt) stellt das aber kein Problem mehr da. Heute vormittag etwa brauchte ich knapp 2 min, dass Wikimedia für die relevanten .svg 26065 Anschriften zusammenstellte; um daraus letztlich die geordnete Wortliste zu bilden brauchte ich vielleicht 5--10 s, um die Namen zweier Skripte einzutippen während diese dann insgesamt für etwa 1 s arbeiteten.
Punkt «automatische Stenogramme»: In «Sarmanns Galerie» hat es Beispiele dafür; teilweise (.pdf, oder als .djvu (lesbar etwa mit Sumatra). Sein Ansatz geht über die Kurzgeschichten und Romane von Dominique Clarier hinaus (Beispiel, die diese auch als Ergänzung zu ihrem Stenokurs sieht. Aus der Vorstellung (Kurzfassung / Langfassung (S. 7 ff.)) entnehme ich, dass im Hintergrund die Worte zerlegt werden, um (auch hier) aus einem Setzkasten sinnvolle Formen auszuwählen, die sodann im Stenogramm zusammengefügt werden. Zumindest für die Leserschaft der DTK hat er (damals) die Programme nicht näher vorgestellt, und auch nicht als elektronische Zusatzinformation bereitgestellt.
Mögliche Texte: Kürzere Texte als die Buddenbrooks um zu beginnen fände ich nützlicher. Denn A) setzt ein kurzer Text die Leseschwelle herab, wie schon beim Fremdsprachenlernen. B) ist bei vermutet geringerem Aufwand rascher zu erkennen, wo die programmatische Umsetzung langschriftlicher Text -> Stenographie problematisch ist. Deshalb mein Vorschlag von Kurzgeschichten. Ad hoc denke ich an die deutschsprachige Abteilung bei librivox -- Stenographie lesen und simultan tatsächlich von aussen hören könnte den Lernerfolg erhöhen, als nur das «normale Lesen». Ein Detail wäre, ob die dort eingesetzten Texte (Project Gutenberg mit c) inzwischen auch in Deutschland gemeinfrei sind (Projekt Gutenberg mit k).--Pythonik (talk) 10:34, 14 September 2020 (UTC)[reply]
@Pythonik
Ja, Sermanns Gallerie hatte ich noch nicht entdeckt. Nach anfänglicher Begeisterung waren mir in dem Konverter doch zu viele "Fehler" und Abweichungen. Aber der Heine-Text in der Galerie ist schon stark. Da kann ich natürlich nicht mithalten. Ich bin für "brute force". Ein Wörterbuch mit 100.000 Wörtern anlegen und da das richtige Wort rauspicken, vielleicht noch etwas Programmierung für den letzten Buchstaben. Kurzgeschichte klingt gut, aber erst in 2-3 Jahren. Was mir als Idee sehr gefällt ist der gesprochene Text dazu (das bekomme ich auch selber hin) und vor allem die Annotation in Langschrift. Das geht auch in Commons (aber nicht in Wikibooks und Wikipedia - scheint sich aber irgendwie einstellen zu lassen: https://commons.wikimedia.org/wiki/Help:Gadget-ImageAnnotator/de - WOHL doch nicht, nicht mal die de-WP oder die en-WP hat es installiert - trotz Installationswünschen.) - Beispiel: Was du heute kannst besorgen. So eine Annotation senkt die Schwelle für Anfänger und Wiedereinsteiger.
2. Ich plane eigentlich einige Kategorien von Dateinamen zu "taggen", um schneller bestimmt Kategorien raussuchen zu können. Hast Du irgendwelche Wünsche dafür? Es sollten nicht zu viele Kategorien werden.
Leonhard Euler (Person)
Leipzig (Geographie); Elbe (Geographie); Harz (Geographie); Niederlande (Geographie)
d. h. (Abk. f. das heißt)
TÜV (Organisation), UNO, Deutsche Bank
Badeanzug v2 (FALSCH); beantragen v2 (falsch) - für rot durchkreuzte Schreibweise
Alle Dateien mit mehr als einem Wort bekommen ein "Z" vor das "DEK" (die Tasse; Das Leben ist keine Generalprobe.)
Alle Dateien mit Konjugationslisten bekommen ein "Y" vor das "DEK" (ich werde, du wirst, ich würde, du würdest ...)
Alle Dateien mit vergleichenden Kürzellisten bekommen ein "X" vor das "DEK" (t, tr, nicht; kann, könn, ver, vor)
Die Leerzeichen aus den Dateien bekomme ich raus, wenn ich:
bei Dateien mit 2 Wörtern ein B vor das DEK setze (der Junge)
bei Dateien mit 3 Wörtern ein C vor das DEK setze (Internationales Olympisches Komitee)
bei Dateien mit ABER kommt ein D vor den Dateinamen
Die einzelnen Wörter würden natürlich auch alle noch mal alleinstehend im "Hauptwörterbuch" ohne Buchstaben vor dem DEK auftauchen.
So würden im Hauptwörterbuch nur noch Dateien mit einem einzigen Wort stehen, die eventuell noch einen "Tag" in Klammern haben.
Fragliche (sonstige) Dateien mit Klammern bekommen ein E vor das DEK
Schnelläufer (alte Rechtschreibung)
meinen (von mein)
Sie (Großbuchstabe)
Vielleicht sollte ich lieber ganz vom Taggen in Klammern absehen und statt dessen lieber nur verschiedene Buchstaben vor das DEK setzen (so würden auch garantiert alle Leerzeichen aus dem Hauptswörterbuch verschwinden):
A - für Abkürzungen
P - für Person
G - für Geographie
O - für Organisation
F - für falsch
N - für nicht empfohlen
Bliebe noch das große Problem mit v1, v2 und v3. Da bin ich mir noch nicht mal sicher, ob nicht viele von diesen Dateien eckig eingeklammert (weil nicht empfohlen) oder rot durchkreuzt werden müssen. Eigentlich sollte ich wenigstens ein v1 hinter alle fraglichen Dateien setzen, damit man diese schnell raussuchen kann und in einer separaten Tabelle zusammenstellen kann.

--Thirunavukkarasye-Raveendran (talk) 09:15, 15 September 2020 (UTC)[reply]

@Thirunavukkarasye-Raveendran:

An eine systematische, später automatische Verschlagwortung ähnlich wie im Spiel «Stadt, Land, Fluss, ...» hatte ich noch nicht gedacht, auch wenn mir schon aufgefallen war, dass es neben den «einfachen Symbolisierungen», die «satzweisen Symbolisierungen» hat. Herauszufinden, ob die Symbolisierung in der Langschrift aus einem, zwei, drei, ... Worten besteht ließe sich vermutlich vergleichsweise einfach lösen wenn im Dateinamen nach Leerzeichen gesucht wird. Dafür könnte eine Regel «Kein Leerzeichen = ein Wort, ein Leerzeichen = zwei Worte, etc.» hinreichend sein. In dieser Perspektive wäre Deine bisherige Herangehensweise, dass es echte Leerzeichen in den originalen Dateinamen hat, sogar vorteilhaft. Das Kriterium «mehr als ein Wort» trifft allerdings auch für die Kontrastsymbolisierungen á la «IG ABER AG» sowie die Konjukationstabellen zu. Gegenwärtig, da die Tafeln einzelne Worte, Gegenüberstellungen, oder nur kurze Wortgruppen enthalten, erkenne ich noch nicht den Mehrwert, die symbolisierten Worte abzuzählen.
Durch Stringvergleich / Analyse des Dateinamens scheint das Heraussuchen der Einträge :A / Abkürzungen möglich, wenn die Anzahl Punkte als ausreichendes Kriterium gelten soll. Da zwischen Stamm und der Endung für den Dateityp schon ein Punkt steht, würde die Regel eben mit «Zwei Punkte Minimum = Abkürzung» schon einen Teil identifizieren («a. D.», «d. h.», «etc.», «z. B.», «vgl.»), unabhängig davon, ob es ein Leerzeichen hat, oder nicht. Nur aus Buchstaben bestehenden Abkürzungen wie «Uni», «UNESCO», «DEK» werden davon aber noch nicht erfasst. Vielleicht ist hier die Regel «zwei, oder mehr als zwei Grossbuchstaben, aber kein Leerzeichen im Dateinname» bereits «gut genug», um das Mehr dieser Beispiele zu identifizieren («Uni» etwa bliebe dabei unentdeckt). Wie ich mit einem meiner Skripte, die Deine .svg elektronische Lernkarten umarbeiten, lernte, setzt ein solcher nur Buchstaben-basiserter Automatismus auch manchmal einen Tag zu oft, wo er (nach DEK's SU) gar nicht hingehört; ein Fehler, der zumindest teilweise mit einer komplementären Silbenanalyse (beispielsweise dezidierte Auffindung «st» am Silbenanfang) korrigiert werden kann.
Konjugationstabellen: Wenn regulär «ich», «du», etc. in den Dateinamen auftaucht, bräuchte ein Skript nur prüfen, ob diese Pronomen im Dateinamen enthalten sind; und falls ja, die Datei sogleich umbenennen.
Variantensymbolisierungen: In diesen Fällen ist das bisher angetroffene Muster vorhersehbar, und das skriptbasiserte Heraussortieren hätte als Kriterium («v1» oder «v2» oder «v3») im Dateinamen. Die nerven- und zeitaufwendige Arbeit ist eher das Finden von Symbolisierungen die eine v2, v3 rechtfertigen; das Beschriften mit v1; und nicht zuletzt, das manuelle Zusammenfügen aus dem Setzkasten.--Pythonik (talk) 07:31, 16 September 2020 (UTC)[reply]
Ich habe eines meiner Skripte erweitert um probehalber mit den mir heute zugänglichen Daten (17. September, 26119 Anschriften) und den neuen Ideen zu arbeiten. Die momentan berücksichtigen Regeln lassen sich sicherlich noch anpassen / ergänzen, aber als Vorschau lassen sich folgende Aussagen treffen: es hat mindestens 43 Tafeln mit einer Abkürzung mit a) mehr als einem Punkt oder b) mehr als einem Grossbuchstaben (ohne Bindestrich, ohne «ABER»-Tafeln). Die Suche nach Konjugation unterstellt bei Anwesenheit mindestens eines der Personalpronomen einen Treffer, hier 334 Vorschläge. Die Suche nach Varianten zählt alle Dateien, die im Namen das ausdrückliche _v1, _v2, _v3 oder _v4 haben und konstruiert (allerdings auf Verdacht) einen Dateinamen, etwa statt Antenne v2.svg auch Antenne.svg. Denn manchmal haben «Variantenbilder _v2» eine Grundvariante, die nicht explizit als _v1 benannt ist. Die Summe in dieser Kategorie: 3481.--Pythonik (talk) 14:44, 17 September 2020 (UTC)[reply]


@Pythonik
So, ich habe mich jetzt (vorerst) für eine "Verschlagwortungs-Struktur" entschieden und mal umgesetzt, morgen ist die riesige Verschiebung fertig, dann stelle ich die Dateien bis übermorgen wieder gezippt auf Dropbox. Die Namenskonvention steht jetzt oben im Abschnitt #Einheitliche Dateinamen - Namenskonvention für diese Kategorie. Keine Struktur ist ideal, besonders bei Mehrfachvererbung. Ohne Buchstabenzusatz vor "DEK" stehen jetzt nur einzelne Wort (eventuell mit v2 oder v3 dahinter, sonst keinerlei Leerzeichen oder Kommas, höchstens Bindestriche oder Hochkomma). Das soll ermöglichen ein sauberes Wörterbuch zu erstellen (bisher musste ich so viele eingestreute unpassende größere Wortgruppen dort par Hand aussortieren.) Daneben sollen auch didaktisch verwendbare Dateien separat gruppiert werden (deshalb: "B" zwei Wort und "C" drei Wort, ist gut für Anfänger und Redewendungen). L (Latein) und E (Englisch) ist natürlich sehr schwammig, da könnte man fast alles einsortieren, dort habe ich nur einige wirklich nichtdeutsche Wörter drin. --Thirunavukkarasye-Raveendran (talk) 20:37, 18 September 2020 (UTC)[reply]
@Thirunavukkarasye-Raveendran
Bisher habe noch keine der Buchstaben aus den Setzkästen entnommen, um eine Symbolisierung zu bilden. Deshalb hat es von mir keine .svg, noch nicht einmal auf privatem Rechner, zum Heraufladen für das Wörterbuch.
Meine Skripte für das Anki deck / die elektronischen Lernkarten schauen sich Wikimedias Downloadanschrift oder / und den Dateinnamen der .svg an, um aus Zeichenfolgen oder der Anzahl von Zeichenfolgen darin Schlüsse zu ziehen. Deshalb vermute ich, dass das Auffinden / Listen / Umbenennen von Dateien der jetzt benannten Kategorien A, B, C, T, V, Y und Z sich mit einem Skript gut automatisieren lassen. Kategorien K, S und X sind kein Abzählen mehr, für einen Vergleich müsste zusätzlich eine Referenz konsultiert werden -- etwa die Liste mit den 100 Kürzeln der SU; etwas mehr Aufwand, aber zum Teil bereits in Erprobung (also, ander, ant, auf, aus, besonder, bis, dar, deine, dessen, deutsch, dies, doch, durch, fort, für, gegen, heit, hint, ion, keine, konnt, lich, lung, meine, mit, nichts, noch, nur, ohne, rung, schaft, schon, seine, selbst, sich, sind, solch, soll, sonder, über, unter, vielleicht, voll, vom, von, völl, wenn, will, wird, woll, worden, wurd, zer, zum, zurück, zurück, zusammen, zwischen) und aber aus anderem Gründen sowieso in Revision befindlich.
Für die Kategorien von Personen (sofern nicht wie bisher im Muster von Herr Max Muster.svg oder Frau Maxi Muster.svg benannt), Firmennamen, oder geographischen Begriffen sehe ich bislang noch keinen zuverlässigen (einem Computer zu lehrenden) Algorithmus.
Die Perspektive auf das lateinische Erbe zu lenken, ist unerwartet, mir aber als Idee sympatisch. Die Schnittmenge mit Englisch, auch über Lateins Töchter, ist gefühlt grösser als mit der aufgeschnappten Faustregel «with three or more syllables, roots of an English word are more likely Latin, than Germanic», wobei a) «Latin» für US-Amerikaner natürlich nicht nur für Latein-an-sich gebraucht wird und b) Griechisch dabei noch gar nicht erwähnt wird. Vielleicht wieder ein programmatischer Vergleich mit einer Liste (etwa von Wiktionary) die es auch neben Einzeleinträgen (Beispiel) haben sollte.
In Hinblick auf die von Dir angekündete Verschiebung: ändert diese die Anschriften der .svg? Das meint praktisch, für die Symbolisierung von abgegeben habe ich momentan diese Downloadanschrift: https://upload.wikimedia.org/wikipedia/commons/9/9c/DEK_Deutsche_Einheitskurzschrift_-_Verkehrsschrift_-_abgegeben.svg. Ändert die Verschiebung den Teil vor DEK, hier /9/9c/? Für meine versuchte Verschlagwortung der .svg ist es aber unproblematisch, wenn sich dieser Teil der Anschrift ändert; dort zählt der Dateiname, alles nach dem letzten Schrägstrich.--Pythonik (talk) 12:27, 19 September 2020 (UTC)[reply]


@Pythonik
Die Verschiebung ist abgeschlossen (ca. 3 Tage, 3000 Dateien). Morgen zippe ich alles und lade es hoch. Der Nachteil ist, dass v1, v2 und v3 manchmal nicht hintereinander im Explorer auftauchen. Auch die aussortierten geografischen Begriffe sind nun leider von abgeleiteten geografischen Begriffen räumlich im Explorer getrennt. Bei den geografischen Begriffen habe ich immer noch den Genitiv mit dazugenommen. Auch die 4 Haupthimmelsrichtungen. Amerika, Amerikas, Norameriks, Europa, Europas, Südeuropa sind nun in er Kategorie "G DEK". In der Kategorie "DEK" verbleiben aber amerikanisch, Amerikaner usw. Auch die Kategorie "P DEK" trennt leider einige Wörter räumlich vom Hauptwörterbuch. Beispielsweise stehen jetzt Franziska und Franziskaner nicht mehr hintereinander. Deshalb werde ich im stenografischen Wörterbuch noch eine Linkliste anlegen, die alle Kategorien wieder vermischt (vielleicht ohne die Kategorien T, X, Y und Z). Das kann ich wohl mit LibreCalc hinbekommen. Im Endstadium sollte es auch eine rückläufig sortierte Liste geben.
Frage: mit welchem gebräuchlichen (käuflichen?) Explorer (Nortencommander) kann man Dateinamen komfortabel massenhaft umbennennen? Oder geht das nur mit einem Batch-Programm (was auch immer das ist)? Mir schwebt im Endstadium (in 2-3 Jahren) vor, ein zweites gezipptes Dateipaket anzubieten, in dem die Dateien wieder wie ursprünglich nur mit "DEK" beginnen, also wie bisher gehandhabt. Das könnte für manchen Benutzer nützlicher sein. Vorerst aber nur eine entsprechend sortierte Liste im "Stenografischen Wörterbuch". --Thirunavukkarasye-Raveendran (talk) 12:01, 20 September 2020 (UTC)[reply]
Die neu zip-Datei (Version 2020-09-20) habe ich nun hochgeladen (auf dropbox und googel-drive). Ich habe dieses mal die Datei nicht - wie sondt - extra noch mal freigegeben und den Downloadlink hier erneuert. Frage: Kannst du sie runterladen? Oder muss ich jedes mal die Datei freigeben. Schließlich ist der Ordner freigegen. --Thirunavukkarasye-Raveendran (talk) 19:22, 20 September 2020 (UTC)[reply]
@Thirunavukkarasye-Raveendran
Das neue rar-Archiv (2020-09-20, 51 MB) habe ich erfolgreich von google-drive herunterladen können. Auspacken wird etwas dauern; Beginn einer An-/Durchsicht ist gewiss nicht vor morgen Abend. In der Zwischenzeit hatte ich sonst die Anschriften angefragt und dann alle .svg neu in etwa 30 bis 45 Minuten direkt von Wikimedia abgeholt, so gesehen ist ein einmal erstelltes grosses Archiv innert einer Minute zu laden natürlich schneller im Download.
Batch script heisst ein Programm, was von der Eingabeaufforderung / cmd.exe aus arbeitet und mit seiner Arbeit nicht nach Datei beendet, sondern an einem ganzen Stapel von Dateien tätig wird. Manchmal hört man auch gleich Stapelverarbeitungsdatei. Skript deshalb, weil of ein paar Stichworte / Einzelbefehle für eine grössere Aktion zusammengeschrieben werden (scribere), ohne dem Programm auch noch eine graphische Oberfläche mit klickbaren Tasten und so aufzusetzen.
Wenn ich in Windows nur Dateien umzubennen habe, nutze ich antrenamer (beispielsweise bei chip.de, https://www.chip.de/downloads/Ant-Renamer_18204061.html, oder installationsfrei von portableapps.com auf einem USB-stift, https://portableapps.com/apps/utilities/ant_renamer_portable). Wenn sowohl viele Dateien umzubenennen sind und auch ein Dateimanager nötig ist, nehme ich noch immer den total commander (https://www.ghisler.com/deutsch.htm, Beispiel Umbenennung https://www.ghisler.com/screenshots/de/06.html.) Schritt-für-Schritt dokumentiert (https://www.ghisler.ch/wikide/index.php?title=Hauptseite, Umbennenung https://www.ghisler.com/advanced.htm#tutorial_rename). Wenn noch nicht bezahlt (shareware) fragt TC am Anfang einmal zufällig nach 1, 2, oder 3 ohne sonstige Einschränkungen. Es lohnt sich das Probieren mit billigen Daten, um sie zu verstehen, bevor es an die teuren (die mit viel Arbeit erstellten) geht. Das Windows95-Design stört mich nicht; denn wie beim Peter Norton Bild auf den Schachteln damals krempeln die beiden einfach die Hemdsärmel hoch und los geht's.--Pythonik (talk) 21:07, 20 September 2020 (UTC)[reply]
Nachtrag Montag, 21. September: Das Archiv ist abermals problemlos entpackbar gewesen.--Pythonik (talk) 19:18, 21 September 2020 (UTC)[reply]

Unklare Schreibung

[edit]
Welche Version ist richtig und warum? Welche ist noch erlaubt aber ungünstig? Welche ist verboten und warum? --Thirunavukkarasye-Raveendran (talk) 18:53, 16 May 2021 (UTC)[reply]