مشروع كارابيلا: ذكاء اصطناعي لكشف أسرار تاريخ إسبانيا

مشروع كارابيلا: ذكاء اصطناعي لكشف أسرار تاريخ إسبانيا


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

الذكاء الاصطناعي (AI) والتعلم الآلي (ML) في خدمة المؤرخين، جنبًا إلى جنب مع الخوارزميات التي تحدد مواقع الوثائق ذات الأهمية الكبيرة لتاريخ إسبانيا. خلفها مشروع كارابيلا، وهو مشروع تم تطويره في العامين الماضيين من قبل باحثين من جامعة البوليتكنيك في فالنسيا (UPV) ومركز الآثار تحت الماء التابع للمعهد الأندلسي للتراث التاريخي.

في هذا الإطار قاموا بتطويرها وتطبيقها تقنيات AI / ML الجديدة التي تسمح بالوصول إلى محتويات أكثر من 130.000 صورة من الأرشيف العام لجزر الهند والأرشيف التاريخي الإقليمي في قادس. تلقى المشروع دعمًا من برنامج المساعدة لفرق البحث العلمي التابع لمؤسسة BBVA في مجال العلوم الإنسانية الرقمية.

"باستخدام هذه التقنيات ، يمكننا تتبع أي مستند رسومي بنفس سرعة محرك بحث الويب ، وتحديد كلمات معينة ، ومجموعات من الكلمات ، والعبارات ، إلخ .... كل هذا بفضل النماذج الإحصائية التي دربناها من الأمثلة والتي أصبحت الآن الحلفاء الكبار لدراسة هذه المجموعات في تاريخ إسبانيا. ويمكن أيضًا تطبيق نفس الأساليب على العديد من الوثائق التاريخية الأخرى "، كما يبرز إنريكي فيدال ، الباحث في مركز التعرف على الأنماط وتقنيات اللغة البشرية (PRHLT) التابع لـ UPV.

الأرشيف العام لجزر الهند

ال أموال الأرشيف العام لجزر الهند وهي ذات أهمية استثنائية لدراسة تاريخ إسبانيا في أمريكا - من جنوب الولايات المتحدة إلى تييرا دي فويغو - والفلبين خلال القرنين الخامس عشر والتاسع عشر.

يتعلق الامر ب المخطوطات المتعلقة بالسفر والتجارة البحرية الإسبانية، التي لا يمكن إجراء تحليلها باستخدام تقنيات النسخ التقليدية لـ OCR - نظرًا لأنها مخصصة للنص المطبوع - ولا باستخدام تقنيات محددة للمواد المكتوبة بخط اليد ، نظرًا لأن النتائج التي تقدمها عند تطبيقها على هذه النصوص التاريخية غير دقيقة للغاية.

يقول جوان أندرو: "سمحت لنا كارابيلا بالمضي قدمًا ، من خلال تقنيات التعلم التلقائي التي تسمح بفهرسة صور النص المكتوب بخط اليد في مجموعات كبيرة من الوثائق التاريخية التي تجعل حالة حفظها وأساليب كتابتها المعقدة من المستحيل تقريبًا على البشر قراءة مستنداتهم" Sánchez ، وهو أيضًا باحث في PRHLT-UPV.

هذه التقنيات قادرة على تحديد وتمييز الأنواع المختلفة من الحروف المستخدمة في كل فترة من الفترات التي تم فيها تأريخ المستندات وحتى تحليل الصور ذات الجودة المنخفضة جدًا.

المفتاح في قدرة خوارزمياتها للحصول على النماذج التي يتم تعلمها تلقائيًا من الأمثلة.

تتطلب مثل هذه النماذج كمية صغيرة نسبيًا من بيانات التعلم للحصول على نتائج مرضية للغاية. تتيح لنا هذه الأساليب الاستجابة بشكل مرضٍ للتحديات التي تطرحها المستندات نفسها ، مثل الاختلافات في التهجئة أو اللطخات أو جودة الصورة. "، يضيف فيدال.

في هذه الحالة، تم التعلم بحوالي 500 صفحة من Archivo de Indias، والتي تم اختيارها ونسخها من قبل كارلوس ألونسو وفريقه من المتخصصين من مركز علم الآثار تحت الماء.

حطام السفن واستراليا

لقد سلطت كارافيل الضوء معلومات مخطوطة عن حطام السفن التي تشكل تراثًا أثريًا من الدرجة الأولى ، بسبب الثراء التاريخي والثقافي الكبير لمحتواها. يوضح جوان أندرو سانشيز أن "كارابيلا يساهم أيضًا في تجنب نهب التراث المغمور بالمياه".

ولكن ، مما لا شك فيه ، حدث أحد أكثر الاكتشافات إثارة للدهشة في هذه الصناديق عند البحث عن مصطلحات ذات صلة بأستراليا ، مثل "Tierra Austral Incognita" ، رسالة من أوائل القرن الثامن عشر موجهة إلى الملك فيليب الخامس.

"في هذه الرسالة التي كتبها اليسوعي أندريس سيرانو ، اكتشفنا إشارات دقيقة جدًا إلى القارة الجنوبية يعود تاريخها إلى عام 1705 ، قبل وقت طويل من وصول الكابتن جيمس كوك إلى شواطئها عام 1770. يشرح إنريكي فيدال أن هناك بيانات غير معروفة عن تاريخ أستراليا والتي نكتشفها الآن من خلال تطبيق تقنيات البحث الاحتمالية والفهرسة التي تم تطويرها في مركزنا.

اقرأ ، العصر الذهبي و Transkribus

في نفس مجال العمل ، شارك فريق PRHLT في مشروع READ الأوروبي ، الذي قام بدراسة وتحليل وثائق العصر الذهبي للأدب الإسباني، بينهم مخطوطات لوب دي فيجا من مجموعة المكتبة الوطنية ، ومراسلات من الأخوين جريم من أرشيف ولاية ماربورغ.

أيضًا من الأرشيف الوطني لفنلندا ، والذي تمت فهرسة حوالي 150 ألف صفحة منه ، وينوي في المشاريع المستقبلية فهرسة حوالي مليون صفحة.

أيضا، في إطار المشروع ، تم تطوير Transkribus، منصة برمجية تسمح بوضع تعليقات توضيحية على صور الوثائق القديمة ذات القيمة التاريخية الكبيرة.

يستخدم Transkribus في المقام الأول كأداة لتوليد بيانات التدريبنظرًا لأن تقنيات التعرف على النص المكتوب بخط اليد تتطلب البيانات للتعلم تلقائيًا. في المستقبل القريب سوف تتضمن ميزات أخرى ، مثل تدريب النموذج الآلي للغات أخرى.

اختتمت READ أيضًا إنشاء تعاونية أوروبية يعد UPV عضوًا مؤسسًا فيها والتي تجعل برنامج Transkribus متاحًا لجميع المستخدمين المسجلين.

حاليا ، منصة Transkribus لديها أكثر من 30000 مستخدم من جميع أنحاء العالم ، مما يجعلها أداة مرجعية دولية لجميع المؤرخين.


فيديو: درست 5 ساعات يوميا عن الذكاء الاصطناعي - هذه النتيجة


تعليقات:

  1. Benon

    أنت ترتكب خطأ. دعنا نناقش. اكتب لي في رئيس الوزراء ، سوف نتحدث.

  2. Akinole

    أخيرًا ظهرت ذرة كانت تنتظر بالفعل

  3. Tempeltun

    قبل بدء البحث عن وظيفة ، اقرأ توصيات الموظفين حول أماكن عملهم على موردنا. وعندها فقط قرر ما إذا كنت ستقدم اقتراحك لهذه الشركة أو تلك. تحقق من التوصيات المختلفة وجعل الاختيار الصحيح.

  4. Anwell

    نعم حقا. لذلك يحدث.

  5. Cumhea

    أنا نهائي ، أنا آسف ، لكن في رأيي ، هذا الموضوع ليس فعليًا.

  6. Victoriano

    عبارة مثيرة للاهتمام



اكتب رسالة