يقوم بتحميل مجموعة بيانات Excel وفحصها، ثم يقرأ ويحلل ملف نصي لاستخراج أسماء العملاء المحددة والقيم النقدية باستخدام التعبيرات العادية.
يقوم دفتر الملاحظات أولاً باستيراد pandas و matplotlib لتحميل ملف Excel clean_canada_data.xlsx في إطار بيانات وعرض الصفوف القليلة الأولى منه للحصول على نظرة عامة سريعة. ثم ينتقل إلى معالجة النصوص:
باستخدام وحدة open المدمجة في Python ووحدة re،
يقرأ Iphone_Order.txt، ويستخرج الاسم الكامل للعميل الثاني الذي يبدأ اسمه بـ "S" وينتهي بـ "er"، ويجد جميع أنماط المبلغ بالدولار (على سبيل المثال "$1,499.99")، ويوضح تقسيم النص عند علامات الترقيم. أخيرًا، يعرض أول خمسة سجلات مع أعمدة رأسية مناسبة لتوضيح تقنيات معالجة البيانات الأساسية ومطابقة الأنماط.
استعرض ملف الخاص بالمشروع أدناه أو اطلب نسخة منه.