Fünfter Programmierwettbewerb gestartet

Damit sich niemand in der Ferienzeit im April langweilen muss und weil wir die Zeit bis zum nächsten größeren freiesMagazin-Programmierwettbewerb, der meistens im Oktober stattfindet, sinnvoll überbrücken wollen, startet heute der fünfte freiesMagazin-Programmierwettbewerb.

Dieses Mal geht es nicht um ein theoretisches Spiel, sondern um eine reale Anwendung. Gesucht wird ein Wortwolken-Generator, der Texte einliest, die Worthäufigkeit zählt und alles als Wortwolke ausgibt. Vor allem die Darstellung der Wortwolke soll den Reiz der Programmieraufgabe ausmachen. Die genaue Details zur Aufgabe findet man auf der zugehörigen Webseite.

Jeder Teilnehmer kann sein Programm an redaktion ETT freiesmagazin PUNKT de senden. Der Teilnahmeschluss ist der 15. April 2012. Wir wünschen allen interessierten Programmierern viel Erfolg und hoffen auf eine rege Beteiligung.

Ihre freiesMagazin-Redaktion

Pingback

[...] wurde gestern fünfte freiesMagazin-Programmierwettbewerb gestartet – wenn ich nicht vergessen hätte, die Nachricht online zu stellen. Daher heute mit [...]

Fragen

Da auf der Wettbewerb-eigenen Seite keine Kommentare möglich sind, stelle ich meine Frage hier.

"rekursive Suche und Analyse von Dateien mit bestimmten Dateiendungen"
Bedeutet das, dass ein Ordner angegeben wird, und alle darin enthaltenen Dateien mit angegebener Endung analysiert werden sollen, anstatt nur einer Datei?

Zur Art des Programmes möchte ich sagen, dass ich die anderen Wettbewerbe besser gefunden habe, weil sie objektiv bewertbar waren. Außerdem waren sie nicht Praxisfern. Algorithmen dieser Art sind nur gut für die Anwender versteckt, sodass diese davon wenig mitbekommen.

Die Beschreibung schließt Gruppenarbeiten nicht explizit aus, ist dies auch so gemeint?

Re: Fragen

Ja, das Programm soll mehrere Dateien gleichzeitig verarbeiten können. Eine rekursive Suche über Ordner bietet sich da an.

Und wie in den vorherigen Wettbewerb ist eien Gruppenarbeit natürlich erlaubt.

Viele Grüße
Dominik Wagenführ
freiesMagazin-Redaktion

Lemmatisierung

Ist eine Lemmatisierung, also die Reduktion eines Wort auf die Grundform erforderlich oder gewünscht? Eine manuelle Lemmatisierung wäre einfach umsetzbar, aber nicht benutzerfreundlich, während eine automatische Lemmatisierung womöglich von sehr wenigen umgesetzt werden kann.

Re: Lemmatisierung

Es ist zumindest nicht gefordert. Aber es würde bei einer Umsetzung natürlich Bonuspunkte bringen, wie jedes andere Feature auch, was zusätzlich eingebaut wird und sinnvoll anwendbar ist.

Viele Grüße
Dominik Wagenführ
freiesMagazin-Redaktion

Fragen

Sehe ich das richtig, dass die Qualität der Wolke nicht bewertet wird? Sprich es ist nicht wichtig welche Worte gewählt werden?

Welche Sprache werden die Dokumente sein?

Das Programm braucht auch keine Gui oder? Ein Bild/HTML generieren reicht?

Hallo, ich zitiere hier mal

Hallo,

ich zitiere hier mal die Beschreibung des Wettbewerbs:

> dass man leicht erkennen kann, welche Worte häufig in dem analysierten Text vorkommen. (Und nein, eine simple Liste mit einer Zahl dahinter ist noch keine Wortwolke.)“
> Aussehen der Wortwolke (30%)“ [im Kontext der Bewertung]

Es ist somit also sowohl wichtig, dass die Wortwolke korrekt ist als auch dass sie ansprechend aussieht.

Die Sprache der Dokumente sollte keine Rolle spielen, und es wird sich auch nicht unbedingt auf natürliche Sprachen beschränkt. Folgendes sollte aber beachtet werden:

> In der Regel sollen Wörter nur aus Buchstaben, Zahlen und Unterstrichen bestehen. In einem deutschsprachigen Text sind aber auch mit einem Bindestrich zusammengesetzte Worte keine Seltenheit. Dementsprechend könnte es auch notwendig sein, eine Liste mit zusammengesetzten Wörtern anzugeben

Da die Trennzeichen einstellbar sein sollen („Eingabe von Trennzeichen“) sind auch andere Sprachen möglich. Eine Analyse bzw. Erkennung der Sprache ist nicht notwendig.

Und nein, eine GUI ist keine Voraussetzung. Ein Skript oder eine Konsolenanwendung sind genauso zugelassen und werden nur nach der generellen Bedienbarkeit bewertet.

Viele Grüße
Dominik Honnef
freiesMagazin-Redaktion

> dass man leicht erkennen

> dass man leicht erkennen kann, welche Worte häufig in dem analysierten Text vorkommen. (Und nein, eine simple Liste mit einer Zahl dahinter ist noch keine Wortwolke.)“
> Aussehen der Wortwolke (30%)“ [im Kontext der Bewertung]

Aus diesem Text schliesse ich, dass ich einfach die häufigsten Worte über alle Dokumente nehmen kann und in eine schön aussehende Wolke packen kann und nur das Aussehen der Wolke bewertet wird (solange die häufigsten Wörter vorkommen)

Sprich es braucht kein clustering der Dokumente oder ähnliches.

> nur das Aussehen der Wolke bewertet wird

Hallo,

wie auf der Wettbewerbsseite beschrieben, gehen nicht nur Form und Layout der Wortwolke zu 30% in die Wertung ein, sondern auch andere Aspekte wie z.B. Geschwindigkeit des Programms! Daher sollte man beim Design der Wortwolke auch die anderen Aspekte nicht außen vor lassen.

Viele Grüße
Matthias Sitte

Java 7

Hallo,
ich wollte anfragen, ob Java in Version 7 am Testsystem zur Verfügung steht.
Greets

Re: Java 7

Derzeit nicht. Wenn es sich leicht einrichten ließe, könnte ich es ggf. installieren. Oder ich muss wirklich auf ein aktuelles Linux zurückgreifen, um den Test durchzuführen. Wenn man ohne Java7-Spzifika auskommt, wäre das aber noch besser. :)

Viele Grüße
Dominik Wagenführ
freiesMagazin-Redaktion