DERS TANITIM ve UYGULAMA BİLGİLERİ

Dersin Adı Kodu Yarıyıl T+U+L (saat/hafta) Türü (Z / S) Yerel Kredi AKTS
Doğal Dil İşleme Projesi CMPE 406 Bahar 03+00+02 Seçmeli 4 8
Akademik Birim: Bilgisayar Mühendisliği Bölümü
Öğrenim Türü: Örgün Eğitim
Ön Koşullar Yok
Öğrenim Dili: İngilizce
Dersin Düzeyi: Lisans
Dersin Koordinatörü: - -
Dersin Amacı: Bu ders, yararlı bilgiler elde etmek için metinsel veri türlerini analiz etme konusunda genel ve göreve özel bilgi sağlamayı amaçlamaktadır. Öğrenciler, söz konusu bilgiyi çıkarmak için metin madenciliği tekniklerini kullanarak bir problem üzerinde pratik olarak çalışacaklardır. Bu amaçla herhangi bir programlama dilini kullanabilirler ancak dersin teorik kısmında öğretilen teorik tekniklerin uygulanması için dersler sırasında Python kullanılacaktır. Dönem sonunda öğrencilerin metinsel verileri ön işleme tabi tutabilmeleri ve bunları yazım düzeltme, POS etiketleme, metin sınıflandırma, anlamsal analiz, duygu analizi vb. gibi ana göreve hazırlayabilmeleri gerekir.
Dersin İçeriği: Ders, metin ön işleme ve normalleştirme, düzenli ifadeler, yazım düzeltme, POS etiketleme, duygu analizi, metin sınıflandırma ve naif Bayes, sınıflandırma algoritmalarının sınıflandırılması ve değerlendirilmesi, Kelime semantiği ve Kelime Gömme gibi konuları kapsayacaktır.
Dersin Öğrenme Çıktıları (ÖÇ):
  • 1- Metinsel verileri anlamak için ön işleme ve analiz etme becerisi.
  • 2- Bu dersin yazım düzeltme, metin sınıflandırma ve POS etiketleme gibi NLP tekniklerini Python gibi bir programlama dili kullanarak uygulayabilme becerisi
  • 3- Metinsel veriler üzerinde sınıflandırma ve kümeleme yapmak için Python gibi bir programlama dilini ve kütüphanelerini kullanabilme.
Dersin Öğrenme Yöntem ve Teknikleri Sınıf içi öğrenme. Programlama ödevleri bireysel olarak yapılacaktır. Ancak gerçek dünyadaki bir soruna yönelik bir çözümün tasarlanması ve uygulanması grup çalışması olarak yapılacaktır. Bu derste öğretilen tüm teorik kavramlar kodlama bölümünde uygulanacaktır.


HAFTALIK PROGRAM

HaftaKonularÖn Hazırlık
1 NLP ve Python'a giriş NLP ve Python'a giriş
2 Metin işleme ve Normal ifadeler Metin işleme ve Normal ifadeler
3 Metin işleme ve Normal ifadeler Metin işleme ve Normal ifadeler
4 Minimum Düzenleme Mesafesi Minimum Düzenleme Mesafesi
5 N-gram dil modeli ve Büyük dil modelleri Ders slaytları ve okuma materyalleri
6 Metin sınıflandırması ve Naïve Bayes Ders slaytları ve okuma materyalleri
7 Yazım düzeltme Ders slaytları ve okuma materyalleri
8 POS etiketleme ve Canlı Proje 1 Ders slaytları ve okuma materyalleri
9 Vektör anlambilimi Ders slaytları ve okuma materyalleri
10 Duygu Analizi Ders slaytları ve okuma materyalleri
11 Duygusal analiz ve Duygular Ders slaytları ve okuma materyalleri
12 Word yerleştirmelerine giriş Ders slaytları ve okuma materyalleri
13 Kelime Semantiği ve ilişkiler Ders slaytları ve okuma materyalleri
14 Canlı Proje 2 Ders slaytları ve okuma materyalleri


ZORUNLU ve ÖNERİLEN OKUMALAR

1) Speech and Language Processing, Jurafsky and Martin, Draft chapters in progress, 2021
2) Foundations of Statistical Natural Language Processing, Christopher D. Manning and Henrich Schütze, The MIT Press, Cambridge, Masachusetts , London, England, 2000


DİĞER KAYNAKLAR

Ders slaytları, Stanford NLP parser gibi web siteleri


DEĞERLENDİRME SİSTEMİ

Yarıyıl İçi ÇalışmalarıSayıKatkı Payı (%)
Proje 2 45
Sunum/Jüri 2 55
Total: 4 100


İŞ YÜKÜ HESAPLAMASI

EtkinliklerSayısıSüresi (saat)Toplam İş Yükü (saat)
Ders Saati31442
Laboratuvar21428
Proje250100
Sunum/Jüriye Hazırlık13030
Toplam İş Yükü (saat):200


PROGRAM YETERLİLİKLERİ (PY) ve ÖĞRENME ÇIKTILARI (ÖÇ) İLİŞKİSİ

# PY1 PY2 PY3 PY4 PY5 PY6 PY7 PY8 PY9 PY10 PY11 PY12 PY13
OC1                          
OC2                          
OC3