خط أنابيب لتصنيف أورام الثدي (الخبيثة مقابل الحميدة) باستخدام نموذج شجرة القرار على بيانات السمات السريرية.
يبدأ دفتر الملاحظات بتحميل مجموعة البيانات Breast cancer.csv باستخدام pandas وعرض الصفوف الأولى. إنه يتجاهل الأعمدة غير التنبؤية (Unnamed: 32)، ويقوم بتشفير التشخيص المستهدف (M → 1, B → 0)، ويقوم بقياس الميزات باستخدام MinMaxScaler. بعد تقسيمها إلى مجموعات تدريب/اختبار، تُدرّب DecisionTreeClassifier(random_state=42)، ثم تُقيّم الأداء عبر الدقة، والدقة، والاستدعاء، ودرجة F1، ومصفوفة الارتباك.
استعرض ملف الخاص بالمشروع أدناه أو اطلب نسخة منه.