استخراج بيانات العملاء الكنديين

يقوم بتحميل مجموعة بيانات Excel وفحصها، ثم يقرأ ويحلل ملف نصي لاستخراج أسماء العملاء المحددة والقيم النقدية باستخدام التعبيرات العادية.

التصنيف
تعلم آلي
تاريخ الإنجاز
April 2024
التقنيات المستخدمة
Python 3 Jupyter Notebook pandas matplotlib re (regular expressions) built-in file
ملف المشروع
غير مسموح بالتحميل إلا بإذن من أمين قحطان. تواصل معه للحصول على الإذن.

نظرة عامة على المشروع

يقوم دفتر الملاحظات أولاً باستيراد pandas و matplotlib لتحميل ملف Excel clean_canada_data.xlsx في إطار بيانات وعرض الصفوف القليلة الأولى منه للحصول على نظرة عامة سريعة. ثم ينتقل إلى معالجة النصوص:
باستخدام وحدة open المدمجة في Python ووحدة re،
يقرأ Iphone_Order.txt، ويستخرج الاسم الكامل للعميل الثاني الذي يبدأ اسمه بـ "S" وينتهي بـ "er"، ويجد جميع أنماط المبلغ بالدولار (على سبيل المثال "$1,499.99")، ويوضح تقسيم النص عند علامات الترقيم. أخيرًا، يعرض أول خمسة سجلات مع أعمدة رأسية مناسبة لتوضيح تقنيات معالجة البيانات الأساسية ومطابقة الأنماط.

معاينة ملف

استعرض ملف الخاص بالمشروع أدناه أو اطلب نسخة منه.

لا يمكن معاينة هذا النوع من الملفات مباشرة.