Semantic Web – Forschungsergebnis (Filme mit Regisseur und Darsteller aus der gleichen Region)

Im letzten Semester habe ich die Vorlesung „Semantic Web“ gehört. Es war eine Pflichtveranstaltung die als „Ersatz“ für das ausgefallene Pflichtmodul „Data Warehousing“ angesetzt worden ist.

Im Rahmen dieser Veranstaltung sollten wir einen selbstgewählten Forschungsauftrag ausführen. Mein Forschungsauftrag: Welche Filme in der Wikipedia haben einen Regisseur und einen Hauptdarsteller, die aus der selben Region kommen? Wie groß ist deren Anteil? Wie sieht das in der IMDB Top250 aus?

 

„Fotothek df roe-neg 0006580 014 Bild Litfaßsäule mit Filmplakaten für „Ernst Thä“ von Roger Rössing – Deutsche Fotothek. Lizenziert unter Creative Commons Attribution-Share Alike 3.0-de über Wikimedia Commons

Und hier ist mein Rechercheergebnis:

Ich in der DBpedia (Semantic-Web-Variante der Wikipedia) 77.794 Filme gefunden und extrahiert. Davon haben 16.225 Filme einen Deutschen Titel. Dazu habe ich aus der DBpedia 223.196 Schauspielungen (Teilnahme bei Film und Fernsehproduktionen) extrahiert, sowie 68.913 Regisseur-Verknüpfungen extrahiert. Außerdem habe ich zur allen Regisseuren und Schauspielern die Geburtsorte und -regionen ausgelesen (104.073).

Und? Aus den 16.225 Filmen erfüllen 342 die besagte Bedingung. Das sind etwa 2,1% aller Filme. Dabei unter Anderem: Mel Brook’s Silent Movie, Das Urteil von Nürnberg, Glengarry Glen Ross, Unheimliche Begegnung der dritten Art und Erst Thälmann – Sohn seiner Klasse.
Interessanterweise: Bei 179 der 342 Filme handelt es sich um die betroffene Region „New York“.

Aber wie viele Filme davon sind in der IMDB Top 250? Drei Stück: Requiem for a Dream, Wie ein wilder Stier und Fahraddiebe. Das sind nur noch 1,2%.

So weit mein Forschungsergebnis. Die gesamte Tabelle mit den dazugehörigen Regisseuren, Schauspielern und der gemeinsamen Herkunftsregion, gibt es nach dem Break.

Weiterlesen

Die Zeugnisse sind da

Heute ist Zeugnis-Tag und ich hab meine Giftblätter bekommen. Wie sieht’s aus?

Studium: 2+
Bloggen: 4
Partei: 3
Erwerbsarbeit: 5
Arbeit: 3+

Fleiß: 3
Mitarbeit: 2
Betragen: 2
Ordnung: 3

So langsam könnte die 5 bei der Erwerbsarbeit mal weg. Aber noch falle ich deswegen nicht durch. Auf jeden Fall will ich an der 4 noch schrauben. Die Kopfnoten sind schon seit der dritten Klasse so. Man wird sehen 🙂