Till Grallert
2022-01-26
Till Grallert, @tillgrallert
Digital History – Offenes Forschungskolloquium
26 Januar 2022
Folien: https://tillgrallert.github.io/slides/dh/2022-digital-history-colloquium
<gap/>
! Digitalität zwischen
Heilsversprechen und Realität<gap/>
! Linguistic
imperialism<gap/>
! Digitalisierung des
Kulturerbes36.20124, 37.16117
<gap/>
! <gap/>
!
… müssen explizit gemacht werden!
<gap/>
!
"حبيبتي، انت جميلة، كساعة اضافية من الكهرباء"
— aya mansour (@aya_mansour_11_) July 31, 2015
هذا غزل أحد المتظاهرين في ساحة التحرير اليوم.
رائعة حقيقة! pic.twitter.com/KI8sAkY719
مريم .. أنتِ جميلة كساعة إضافية من الكهرباء ..
— Jawdat Alsaleh (@JawdatAlsaleh) June 27, 2017
كتبها عاشق في فلسطين - غزة pic.twitter.com/W3QvpmaE3O
#سأكتب_على_الجدار
— A - M .. Syria (@Azrael90) January 17, 2018
أنتِ جميلة كساعة إضافية من الكهرباء pic.twitter.com/jKpLnnlorR
<gap/>
! <gap/>
! <gap/>
! ‘Linguistic imperialism’ is shorthand for a multitude of activities, ideologies, and structural relationships. Linguistic imperialism takes place within an overarching structure of asymmetrical North/ South relations, where language interlocks with other dimensions, cultural (particularly in education, science, and the media), economic and political
(Phillipson „Realities and Myths of Linguistic Imperialism“ 1997, 239)
The basis for the codes, languages, methodologies, and technical instruments of the digital humanities is English; the written and spoken language of all the main conferences, the most prestigious journals, the institutions that control the discipline, the organizations and international consortia, and the central authorities of knowledge is, with few exceptions, some dialect of British or American English.
(Fiormonte „Taxation Against Overrepresentation?“ 2021, 334–35)
Englisch ist die Lingua Franca und Basis der technischen Infrastruktur
Schriften und Sprachen des Globalen Nordens sind der Hegemon der Interfaces
كانت أميركا مجهولة عند ابنآء القرن الخامس عشر بدليل ان المؤرخين في ذلك العهد لم يذكروا عنها سوى اخبار اكتشافها في أواخر ذلك القرن
(Zakham „Amīrkā wa-ʿulamāʾ al-ʿArab“ 1907)
کاںٮ امىرکا محهوله عںد اٮںا الٯرں الحامس عسر ٮدلىل اں المورحىں ڡى دلک العهد لم ىدکروا عںها سوى احٮار اکٮساڡها ڡى اواحر دلک الٯرں
rasm
كانت أميركا مجهولة عند ابنآء القرن الخامس عشر بدليل ان المؤرخين في ذلك العهد لم يذكروا عنها سوى اخبار اكتشافها في أواخر ذلك القرن
(Zakham „Amīrkā wa-ʿulamāʾ al-ʿArab“ 1907)
Kānat Amīrkā majhūla ʿinda abnāʾ al-qarn al-khāmis ʿashr bi-dalīl anna al-muʾarikhīn fī dhalika al-ʿahd lam yadhkarū ʿanhā siwā akhbār iktishāfihā fī awākhir dhalika al-qarn
Umschrift (IJMES)
Browser ignorieren das HTML5 Attribut @lang
und
stellen Arabisch linksbündig dar
<gap/>
! Digitalisierung ist teuer: public-private partnerships, private vendors
Platformen zur Maximierung des Gewinns
ʿ
wird
komplet herausgefiltert, '
und ʾ
nicht)Welche Verzerrungen bildet die Karte ab: Sammlung, Katalogiesierung, Digitalisierung der Wissensinfrastruktur?
<gap/>
<gap/>
!Arabische Periodika bis 1929 weltweit
Zum Vergleich: “Der Erste Weltkrieg im Spiegel hessischer Regionalzeitungen”
Katalogisierungsregeln und algorithmische Copyrightbestimmung verstärken Unzugänglichkeiten
<gap/>
ID | based on | ground truth | words | lines | epochs | CER train | CER validation |
---|---|---|---|---|---|---|---|
15946 | al-Ustādh | 192829 | 18732 | 200 | 2.01 | 2.09 | |
13864 | al-Muqtabas | 11116 | 1013 | 200 | 0.07 | 8.40 |
<gap/>
Periodikum | DOI | Bände | Ausgaben | Artikel | Wörter |
---|---|---|---|---|---|
al-Ḥaqāʾiq | 10.5281/zenodo.1232016 | 3 | 35 | 389 | 298090 |
al-Ḥasnāʾ | 10.5281/zenodo.3556246 | 1 | 12 | 201 | NA |
al-Manār | 35 | 537 | 4300 | 6144593 | |
al-Muqtabas | 10.5281/zenodo.597319 | 9 | 96 | 2964 | 1981081 |
al-Ustādh | 10.5281/zenodo.3581028 | 1 | 42 | 435 | 221447 |
al-Zuhūr | 10.5281/zenodo.3580606 | 4 | 39 | 436 | 292333 |
Lughat al-ʿArab | 10.5281/zenodo.3514384 | 3 | 34 | 939 | 373832 |
total | 56 | 795 | 9664 | 9311376 |
Hypothese: geographische Herkunft von Artikeln in einem Periodikum erlaubt Rückschlüsse über seine Bedeutung
<byline>
<placeName ref="oape:place:9 geon:268064">صيدا</placeName>
<persName ref="oape:pers:2845">مريم زكا</persName>
</byline>
<place type="town" xml:id="place_9">
<placeName type="simple">Saida</placeName>
<placeName xml:lang="ar-Latn-x-ijmes">Ṣaydā</placeName>
<placeName xml:lang="en">Sidon</placeName>
<placeName xml:lang="ar">صيدا</placeName>
<location>
<geo>33.55751, 35.37148</geo>
</location>
<idno type="url">http://en.wikipedia.org/wiki/Sidon</idno>
<idno type="geon">268064</idno>
<idno type="oape">9</idno>
</place>
والأصح الدرعية بلام التعريف (راجع <bibl subtype="journal" type="periodical">مجلة <title level="j" ref="oape:bibl:3 oclc:1034545644">الزهور</title> المصرية <biblScope unit="volume" from="2" to="2">٢</biblScope> : <biblScope unit="page" from="292">٢٩٢</biblScope></bibl>)
وانتخب <persName>فؤاد أفندي الدفتري البغدادي</persName> و<bibl><editor><persName>نوري أفندي</persName></editor> راس كتاب <textLang otherLangs="ota">القسم التركي</textLang> في <bibl type="periodical" subtype="newspaper">جريدة <title ref="oape:bibl:532">الزهور</title></bibl> البغدادية</bibl> نائبين عن <placeName ref="oape:place:372 geon:94824">كربلاء</placeName>.
<person>
<persName><roleName type="pseudonym">ساتسنا</roleName></persName>
<persName><roleName type="pseudonym">أمكح</roleName></persName>
<persName><roleName type="pseudonym">فهر الجابري</roleName></persName>
<persName><roleName type="rank">الأب</roleName> <forename>أنستاس</forename> <forename>ماري</forename> <surname><addName type="nisbah">الكرملي</addName></surname></persName>
<persName><forename>أنستاس</forename> <forename>ماري</forename> <addName type="nisbah">الألياوي</addName> <surname><addName type="nisbah">الكرملي</addName></surname></persName>
<persName><forename>بطرس</forename> <addName type="nasab">بن <forename>جبرائيل</forename></addName> <forename>يوسف</forename> <surname>عواد</surname></persName>
<idno type="VIAF">39370998</idno>
<idno type="oape">227</idno>
<idno type="wiki">Q4751824</idno>
<birth><date source="viaf" when="1866-08-05">1866-08-05</date> in <placeName ref="oape:place:216 geon:98182">Baghdad</placeName></birth>
<death><date source="viaf" when="1947-01-07">1947-01-07</date> in <placeName ref="oape:place:216 geon:98182">Baghdad</placeName></death>
</person>
<gap/>
!<gap/>
!Beiträger_innen zu Project Jarāʾid: Hala Auji, Philippe Chevrant, Marina Demetriadou, Lamia Eid, Stacy Fahrenthold, Ulrike Freitag, Rana Issa, Nicole Khayat, Peter Magierski, Leyla von Mende, Adam Mestyan, Christian Meier, Daniel Newman, Geoffrey Roper, Sinai Rusinek, Philip Sadgrove, Ola Seif, and Rogier Visser
Beiträger_innen zu OpenArabicPE: Jasper Bernhofer, Dimitar Dragnev, Patrick Funk, Talha Güzel, Hans Magne Jaatun, Jakob Koppermann, Xaver Kretzschmar, Daniel Lloyd, Klara Mayer, Tobias Sick, Manzi Tanna-Händel, and Layla Youssef
Beiträger_innen zu OCR: Adam Mestyan, Sinai Rusinek
Links:
Licence: slides and plots are licenced as CC BY-SA 4.0