Wednesday, August 13, 2014

Fact ranking quiz

We have developed a fun and exciting quiz which will allow us to tackle one scientific problem and we would love for you to participate and help us out!

The problem is that, as we all know, there is too much information available on the web. How do we decide which facts are important or most relevant for a certain object?

Many fact ranking systems have already been developed, trying to solve this issue. However, the difficulty is that there is no gold standard corpus which could serve as a ground truth for evaluating their performances.

How do you determine, which information or fact is more important or relevant than another? Just a quick example. Let's assume we have the following two facts:

  • (1) Albert Einstein is a physicist.
  • (2) Albert Einstein is a Vegetarian.

Which of the two facts is more important or relevant? Yes, this is difficult to answer, simply because the truth often lies in the eye of the beholder. For a vegetarian, maybe the second fact is more important. But, what about the most common opinion? What would the mainstream think? Probably, most people would say that fact (1) in general is more important.

You might interrupt your rating of the presented facts at any time you like and continue later. To make it a bit more interesting, you can also score points and of course there is a highscore list. We would really appreciate your help in this task. Please do also spread the word. The more participants, the more valid our ground truth will be.

While you are playing this game, your inputs (which are greatly appreciated) will contribute to our scientific experiment. Together, we will build a first corpus that will help our scientific community in evaluating different fact ranking strategies!

This ground truth is achieved with this little 'voting' application [1]. You just have to register with the tool and then the task will be explained to you in detail.

We took 500 popular concepts from Wikipedia and you have (1) to think about the most important facts about these concepts that come to your mind and then (2) rate the (new) facts presented to you according to their relevance. There is no right or wrong answer. Just vote as you think it seems right for you. Afterwards, we will aggregate all votes from all participants to determine the general (mainstream) relevance of the presented facts.

Tuesday, August 5, 2014

Template für die Ausarbeitung

Bitte verwendet für die Ausarbeitung zum Seminar das LaTeX-Template der Muster-Ausarbeitung (falls ihr einen anderen LaTeX Stylesheet für passender haltet, könnt ihr auch darauf zurückgreifen). Die Arbeit sollte nicht mehr als 15 Seiten (nach Rücksprache auch mehr) umfassen und bis Sonntag, der 31.08.2014 abgegeben werden.

Wie schon gesagt, sollte die Ausarbeitung in Form einer Dokumentation erfolgen. Da die vorgestellten Technologien recht divers waren, können wir keine fixen Inhalte verlangen. Es sollte aus der Arbeit hervorgehen, was die eingesetzte Technologie macht bzw. machen kann, wozu man sie einsetzen kann und eventuell auch wofür lieber nicht. Verweist dabei ruhig auf vorhandene Dokumentationen und wiederholt nicht alles, wenn es dort bereits ausführlich beschrieben ist. Zum praktischen Teil, wäre wichtig, wie eure Beispielimplementierung aussieht, welches Problem ihr gelöst habt und wie es dann von euch umgesetzt wurde. Auch hier könnt ihr auf eventuell eingerichtete Repositories verweisen. Beschreibt auch die Fallstricke, die euch aufgefallen sind, und wie man die Technologie an sich oder eure Lösung weiterhin verbessern könnte.

Es wäre natürlich schön, wenn wir von euch auch den Code zur Verfügung gestellt bekommen, gerne auch in öffentlichen Repositories (z.B. GitHub), und inklusive einer Installationsanleitung (README).

Links zur Musterausarbeitung bzw. zu Latex Handbooks und Tools:

Thursday, May 15, 2014

Freie Hiwi-Stellen

Wir suchen ab sofort eine wissenschaftliche Hilfskraft (Umfang: 7 Stunden / Woche, ab sofort) als Unterstützung beim openHPI-Kurs "Knowledge Engineering with Semantic Web Technologies". Der Kurs findet vom 26.05.2014 bis 15.07.2014 statt. Die Aufgaben umfassen die qualitative Überprüfung der wöchentlichen und abschließenden Übungs- und Prüfungsaufgaben, redaktionelle Unterstützung beim Kursaufbau sowie die Interaktion mit Teilnehmern im Forum.

Darüber hinaus gibt es stets noch weitere interessante Aufgabenbereiche innerhalb unserer Arbeitsgruppe. Welche das genau sind, könnt ihr erfragen.

Bei Interesse meldet euch bei uns und ihr könnt es gerne auch weitersagen.

Friday, April 11, 2014

Data|Hack|Award Bootcamp 11./12. April

Leider sehr kurzfristig: Heute und morgen findet ein Bootcamp zum Fusepool Data|Hack|Award statt. Kurzfristige Teilnahme ist möglich. Es wird unter anderem der Apache Stanbol Toolstack vorgestellt. Wer also Lust darauf hat, ist gerne gesehen und kann am Montag davon berichten. Im Rahmen des Data|Hack|Award besteht die Möglichkeit eine Förderung zu gewinnen, die es ermöglichen soll, das eingereichte Projekt zu Ende zu führen. Das Ganze kann gerne mit dem Seminarthema verknüpft werden.

Monday, April 7, 2014

Kickoff Meeting Slides online

Die Folien zum heutigen Kickoff-Meeting liegen im Materialienordner.

Topic Enrollment

Please commit to a topic by adding your name to the topic. Conflicts and group formation will be solved in the second meeting.

If you find a topic or subtopic interesting that is not yet present in the list, feel free to add it. If possible, please provide at least one recent research paper.

Thursday, April 3, 2014

Linked Data – Preview

Um mit dem Seminarthema warm zu werden, ein einleitender Überblick zu Linked (Open) Data: