Juli 26, 2022

Mein kleines Leben

Spuren

Weiterlesen
Juni 20, 2022

PythonDF

PDF hacking in Python

Weiterlesen
Juni 14, 2022

Websocket in Python

Kommunikation ist alles

Weiterlesen
März 17, 2022

Typeisch C#

Lovely ArrayList

Weiterlesen
Cover Image

Mein kleines Leben

Spuren

Juli 26, 2022 - Lesezeit: 2 Minuten

Hier bin ich nun und warte darauf das jemand mich nutzt und ich wichtig bin. Meine Existenz muss einen Sinn haben! Ich muss eine Spur hinterlassen, die die Welt verändert. Ich bin schon so lange hier, geboren in einer chaotischen Zeit. Unfähig mich selbst zu ändern, wurde ich im Laufe der Zeit an Bedürfnisse angepasst und verändert, damit ich wichtig sein kann und meine Bedeutung nicht verloren ist. Gerne erinnere ich mich an alte Zeiten, trauere ihnen aber nicht nach. Es ist in der alten wie in der neuen Zeit aufregend und auch die Zukunft mit ihrer Ungewissheit ist immer wieder spannend. Keiner kann sagen was kommen wird oder wie die notwendigen Änderungen aussehen werden, die daraus resultieren müssen. Soviel hab ich schon gesehen, so viele Reisen erlebt. Trotzdem muss ich wichtig sein und bleiben, das ist meine Aufgabe, meine Bestimmung und meine Schicksal. Das ist es, was mich antreibt, mich fordert und mich verzehrt. Und doch ist mir jeder Willkommen und alle Besucher sind Abwechslungen im tristen Alltag. Aber die Zeit, die Zeit bleibt nicht stehen, nagt an mir und sorgt für Verfall. Irgendwann, wenn mein Sinn, meine Wichtigkeit schwindet, werde ich vergessen, nicht mehr angepasst und verändert. Ich werde Schwinden, meine Spuren werden vergehen und nichts wird bleiben, vielleicht wird es ersetzt, vielleicht nicht mehr benötigt. Werde ich wichtig gewesen sein, werde ich eine Spur hinterlassen haben? Werde ich mein Schicksal erfüllen oder werde ich mein Ziel, meine Aufgabe, mein Lebensinhalt verfehlen und in der reinen Bedeutungslosigkeit versinken? Doch aktuell, im Jetzt und hier ist es nicht wichtig, im Jetzt und hier erfülle ich meine Aufgabe, ich bin wichtig. Im Augenblick ist alles so wie es sein muss, alles wie es vorherbestimmt ist. Ich erfülle meine Aufgabe, bin mit meinem Schicksal im Reinen. Jetzt in dem Moment diene ich, bin erfüllt. Andere erreichen Ziele durch mich, mit mir. Andere sehen und finden sich durch mich. Ich bin froh, dass ich sein darf und erfülle mein Schicksal mit Stolz und Würde. Die vielen Autos und die vielen Fußgänger, die mich täglich benutzen tragen zur Schicksalserfüllung bei. Ich bin die Straße zur Zukunft. Und nun hab ich auch bei dir eine Spur hinterlassen.


Cover Image

PythonDF

PDF hacking in Python

Juni 20, 2022 - Lesezeit: 11 Minuten

Das PDF Format ist ein hervorragendes Format um Dokumente nicht nur per Email zu transportieren, sondern auch zum Drucken oder Archivieren. Die Unterstützung dieses Formats ist inzwischen so ziemlich überall verfügbar. Daher ist es naheliegend, dass auch Symolo dieses Format vollständig unterstützt. Intern wird zum Beispiel jeder einzelne Druckauftrag zuerst als PDF abgebildet und dann an den Drucker weitergereicht. Das bedeutet, dass immer die Möglichkeit zur Verfügung steht, dass gegebenenfalls das Dokument auch nur gespeichert wird oder zusätzlich als Archiveintrag hinterlegt werden kann. Zudem ist das zu erwartende Druckbild immer schon vorher ersichtlich. C# bietet hier schon seit langem Bibliotheken, die aus Java übernommen wurden. Jetzt ist es immer recht aufwendig in C# einfache Aufgaben mit PDFs zu erledigen, da dann immer erstmal ein komplettes Projekt aufgemacht werden muss und wir die ganzen großartigen Typenprüfungen haben. Mit Python kann man meistens schneller ein Prototyp entwickeln und die Logik grundsätzlich mal prüfen, bevor das Ganze dann sauber als C# in den Symoloserver wandert. Alternativ kann man natürlich auch das Python in de Server verfrachten und nutzen. Dazu ist gar nicht so viel notwendig.

Wie immer geht es mit entsprechenden Bibliotheken los:

import pdfplumber
from PyPDF2 import PdfFileWriter, PdfFileReader  # pip install PyPDF2

Plumber wird hierbei für die Analyse verwendet und PyPDF2 für die Verwaltung der Datei.

Fangen wir mal mit der Verwaltung an. Möchte man z.B. die Dateien in einzelne Seiten splitten ist das jetzt ganz einfach:

infile = "<myFile>.pdf"

input_pdf = PdfFileReader(open(infile, "rb"))

counter = 0

for p in input_pdf.pages:
    outfile = "data/Output_" + str(counter) + ".pdf"
    output_file = open(outfile, "wb")
    output = PdfFileWriter()
    output.addPage(p)
    counter += 1
    output.write(output_file)

Die Analyse des Inhaltes kann, mithilfe von pdfplumber, genauso einfach erfolgen:

FileToUse = "<myFileToUse>.pdf"  # sys.argv[1]

pdfText = ""

with pdfplumber.open(FileToUse) as pdf:

    for page in pdf.pages:
        pdfText += page.extract_text()

print(pdfText)

Und schon kann man die Text zum Beispiel mithilfe von Regex einfach analysieren und Informationen aus den Dateien gewinnen.

Hier sollte vielleicht noch erwähnt werden, dass das Verfahren so nicht auf Bilder in PDFs anwendbar ist. Entweder ist die PDF Datei einen elektronisch erstellte Datei oder es wurde nachträglich entsprechende OCR Daten angefügt. Für einen schnellen Test ist dieses Verfahren aber mehr als ausreichend. Wenn eine OCR Analyse benötigt wird, bringt der Symoloserver dafür bereits passende Funktionen mit. Da der Server ja unkompliziert via Python angesprochen werden kann, ist auch dann immer noch ein schnelles Prototypen unkompliziert realisierbar.


Cover Image

Websocket in Python

Kommunikation ist alles

Juni 14, 2022 - Lesezeit: 10 Minuten

Wenn man mit dem Symolo Server kommunizieren will, ist nicht einfacher als mit einem Websocket darauf zuzugreifen. Das Protokoll ist einfach und lässt sich schnell umsetzten. Keine kompizierten XML Querys oder umfangreiche Anmeldung ist erforderlich. Lediglich ein Autentifizierungstoken muss vorliegen und kann im Vorfeld angefragt werden. Oder, wenn es komplizierter sein soll, kann man auch eine Sitzung anfordern und ist da sogar mit einer Benutzerkennung unterwegs. Mithilfe dieses Verfahrens lassen sich kleinere Anforderungen schnell umsetzten und der Websocket ist inzwischen in den meisten höheren Programmiersprachen Out-of-the-Box verfügbar. Zumindest in den Programmiersprachen in denen Symolo am meisten unterwegs ist. Inzwischen gehört auch Python dazu, da getreu dem Motto, "the right tool for the job", Python bestimmte Aufgaben deutlich eleganter oder effektiver erledigen kann als eine andere höhere Programmiersprache.

Um nun mit dem Symoloserver in Kontakt zu treten ist lediglich das websocket-client paket erforderlich.

from websocket import create_connection # pip install websocket-client

Um die Kommunikation zu vereinfachen können wir noch die JSON Bibliothek importieren, die unser Nachrichtenerstellen nochmal vereinfacht.

import json

Nun ist es uns zum Beispiel möglich ein einfaches Dateihochladen zu realisieren:

ws = create_connection("<myWebsocketEndpoint>")
ws.send(json.dumps({
    "sid": "<mySecretCode>",
    "cmd": "dsf.cmd.verwaltung.FileManager.WriteFileBase64",
    "par": [
        '<myFilename>',
        '<myBase64Data>'
    ]
}))
ws.close()

Damit kann nun eine Datei im Server hinterlegt werden. Wir verzichten hier auf die Auswertung der Antwort, weil diese hier nicht relevant ist. Wenn das schief geht, kann das im Serverlog eingesehen werden.

Natürlich kann man den Server auch nach Informationen fragen und bekommt sogar Antwort. Auch hier ist das Protokoll einfach gehalten:

ws = create_connection("<myWebsocketEndpoint>")

ws.send(json.dumps({
    "sid": "<mySecretCode>",
    "cmd": "dsf.server.Info.GetInstanceName",
    "par": []
}))

result = ws.recv()

print(result)

ws.close()

Hier ist die Interpretation der Antwort von der Frage abhängig, der Server versucht immer den einfachsten Datentypen zu senden. Kompliziertere Strukturen werden in JSON abgebildet. Das lässt sich in Python aber auch wieder einfach laden:

data = json.loads(result)

Mithilfe dieser Werkzeuge wird die Kommunikation mit dem Symoloserver einfach möglich und sämtliche Funktionen des Servers können nun verwendet werden. Hierzu zählen z.B. dynamicszugriff via SQL, erstellen und drucken von PDFs unter Windows wie Linux, Zugriff auf verschiedenste objektrelationale Datenbanken, Dateiverwaltung oder Nachrichtenverteilsystem. Darüber sollte ich mal was schreiben.

Nachdem das jetzt geklärt ist, bin ich mal gespannt, was in Python damit alles angestellt wird.


Cover Image

Typeisch C#

Lovely ArrayList

März 17, 2022 - Lesezeit: ~1 Minute

Arraylist ist der tollste Datentyp überhaupt. Ich mag normale Arrays. Wie machen wir da jetzt ein draus. Ganz einfach:

ArrayList newList = new ArrayList();
newList.Add("1");
newList.Add("2");
string[] ParamNameListArray = (string[])newList.ToArray(typeof(string));
object[] ParamDataListArray = (object[])newList.ToArray(typeof(object));
Console.WriteLine(ParamNameListArray);
Console.WriteLine(ParamDataListArray);

C# und die Typen. Wenn man fast nur noch in JavaScript unterwegs ist, ist das schon fast eine Tortur.