Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.12416/15956

Browse

Search Results

Now showing 1 - 4 of 4

An Adaptive and Context-Aware Text Segmentation Method for Information Retrieval
(2026) Şirin, Burçe; Arslan, Serdar
Günümüzde dijital uygulamaların artmasıyla birlikte metinsel verilerin hacmi artmakta; ayrıca dil, yapı, içerik, uzunluk gibi özellikler bakımından giderek daha çeşitlenmekte ve karmaşıklaşmaktadır. Böyle geniş bir bilgi havuzunda bireylerin ihtiyaç duydukları bilgiye doğru ve etkin bir şekilde erişmeleri giderek zorlaşmakta; bu da bilgi erişim sistemlerini vazgeçilmez hale getirmektedir. Ancak bu sistemlerde, özellikle uzun ve içerik açısından zengin metinlerin tek parça halinde ele alınması anlamsal kayma ve işlem maliyetinin artması sorunlarına yol açabilmektedir. Bu sorunların çözümü için, metinlerin anlam bütünlüğü korunarak daha küçük parçalara ayrılmasını amaçlayan çeşitli metin segmentasyon yöntemleri geliştirilmiştir. Bununla birlikte, mevcut çalışmalar segmentasyon başarısının veri seti özellikleri ve görev gereksinimlerine bağlı olarak değiştiğini ve tüm senaryolar için geçerli tek bir yaklaşım bulunmadığını göstermektedir. Bu durum, yeni ve uyarlanabilir yöntemlere olan ihtiyacı ortaya koymaktadır. Bu tezde, bu ihtiyaçtan yola çıkarak, veriye ve bağlama duyarlı bir segmentasyon yöntemi önerilmekte ve bilgi erişimi açısından verimliliği ve etkinliği değerlendirilmektedir. Önerilen yöntemde öncelikle metinler cümlelere ayrılmakta ve her cümle için yoğun vektör temsilleri oluşturulmaktadır. Ardışık cümleler arasındaki anlamsal ilişkiler, bu vektörleri kullanan bir maliyet fonksiyonu ile modellenmekte ve dinamik programlama yaklaşımı ile küresel maliyeti en aza indiren segment sınırları belirlenmektedir. Önerilen yöntem, farklı veri kümeleri ve vektör temsili oluşturma stratejileri kullanılarak bir bilgi erişim hattı üzerinde bir referans yöntemle karşılaştırılmıştır. Değerlendirmeler, ortalama segment boyutlarına, segmentasyon süresine ve MRR, DCG ve nDCG bilgi erişim metriklerine göre yapılmıştır. Deneysel bulgular, önerilen yöntemin verimlilik açısından başarılı olduğunu ortaya koymaktadır. İyileşmeler sınırlı düzeyde olmakla birlikte, etkin bilgi erişimi konusunda da tutarlı kazanımlar sağlandığı gözlemlenmiştir.
Improving File Security through an Optimized Auto-Classification Approach Using Learning Models
(2024) Açıkgöz, Zeliha; Arslan, Recep Sinan; Arslan, Serdar
PDF dosyalarını hedef alan kötü amaçlı yazılımlar dijital güvenlik açısından ciddi bir tehdit oluşturmaktadır. Bu çalışmada PDF dosyalarının sınıflandırılması için kapsamlı bir yöntem önerilmiştir. Çalışma kapsamında PyPDF2, PDFMiner ve PyMuPDF kütüphaneleri kullanılarak PDF'lerden 43 farklı genel ve yapısal özellik çıkarılmıştır. Çalışmada iki faklı aşama bulunmaktadır. İlk aşamada kullanılan veriseti tek sütun olacak şekilde TF-IDF, N-gram Count Vectorizer ve Word2Vec yöntemleri ile sayısallaştırılarak özellik seçimi yapılmadan model eğitimlerinde kullanılmıştır. İkinci aşamada ise metin içeren sütunlar Word2Vec ile sayısallaştırıldıktan sonra özellik seçim yöntemleri uygulanarak model eğitimlerinde kullanılmıştır. İlk aşamada yedi farklı makine öğrenmesi ve dört farklı derin öğrenme modeli uygulanmıştır. İkinci aşamada ise makine öğrenme modellerine ek özgün tasarlanmış Çok Dallı CNN modeli kullanılmıştır. Özellik seçiminde SelectKBest, Recursive Feature Elimination (RFE) ve Lasso yöntemleri uygulanmıştır. Önerilen Çok Dallı CNN mimarisi özellik seçimi yöntemlerinin sonuçlarına uygulanmıştır. Çok Dallı CNN modeli yapılan test sonucunda Lasso özellik seçimiyle 0.9982 doğruluk değeri elde edilmiştir. Makine öğrenimi modelleriyle yapılan deneyler, özellik çıkarımı olan ve olmayan veri setleri üzerinde değerlendirilmiş ve karşılaştırmalı olarak doğruluk, kesinlik, geri çağırma oranı ve F1 puanı gibi metrikler her iki aşama için de analiz edilmiştir. Çalışma, yaklaşık 30.000 PDF dosyasından oluşan kapsamlı bir veri seti üzerinde test edilmiştir. Elde edilen sonuçlar, PDF tabanlı kötü amaçlı yazılımların tespiti için etkili bir yaklaşım sağlamayı amaçlamaktadır.
Çeşitli Türkçe Metinlerin Gelişmiş Duygu Sınıflandırması İçin Hiyerarşik Kapılı Dikkat Ağı ve Yinelemeli Sinir Ağının Birleştirilmesi
(2024) Eke, Simay; Arslan, Serdar
Duygu sınıflandırması, metinlerdeki bağlamları ve eğilimleri belirlemede önemli bir süreçtir. Doğal dil işleme ve derin öğrenmedeki son gelişmeler nedeniyle sinir ağları gibi yöntemler duygu sınıflandırmasında çok daha fazla önem kazanmıştır. Bu çalışma özellikle gömme yöntemlerini, dikkat ağlarını ve mekanizmalarını, Yinelemeli Sinir Ağlarını vurgulamaktadır. Çalışma karakter ve kelime gömmelerinin modelleri ve metin analizini nasıl geliştirdiğini, dikkat mekanizmalarının bilginin belirli bölümlerine nasıl vurgu yaptığını ve daha fazla dikkat ettiğini, Uzun Kısa Süreli Bellek ağlarının metindeki uzun vadeli bağımlılıkları ve zamansal değişimleri nasıl oldukça etkili bir şekilde yakaladığını incelemektedir. Hem kısa, yapılandırılmamış hem de uzun, yapılandırılmış Türkçe metinlerin duygularını tek bir modelde analiz etmek amacıyla Uzun Kısa Süreli Bellek ve Hiyerarşik Kapılı Dikkat Ağı birleştirilerek bir hibrit model geliştirilmiştir. Ayrıca önerilen modelin performansını değerlendirmek için Twitter verisi kullanılarak yeni bir Türkçe veri seti oluşturulmuş ve etiketlenmiştir. Hiyerarşik Kapılı Dikkat Ağı, hem kelime hem de cümle düzeylerinde temel bilgileri önceliklendirerek ikili bir rol oynar ve böylece metnin hiyerarşik yapısını daha etkili bir şekilde yakalar. Bu yaklaşım, Uzun Kısa Süreli Bellek Ağlarının güçlü yetenekleriyle birleştiğinde duygu sınıflandırması için sağlam bir çerçeve oluşturur. Deney sonuçları, bu yöntemlerin birleştirilmesinin duygu sınıflandırmasının performansını artırdığını ve Türkçe metinlerdeki bağlamların daha kapsamlı bir şekilde anlaşılmasını sağladığını göstermektedir. Çalışma, bu tekniklerin nasıl uygulandığını ve bu uygulamaların modelin duygu sınıflandırması üzerindeki etkilerini ayrıntılı olarak inceler ve bunları diğer yapılandırmalar, yöntemler ve modellerle karşılaştırır.
Attention Mekanizmaları ve Hibrit ViT-ResNet Mimarisi ile Gemi Görüntülerinin Çok Sınıflı Sınıflandırılması
(2025) Ergün, Berkay; Arslan, Serdar
Bu tezde, gemi görüntülerinin çok sınıflı sınıflandırılması için Vision Transformer (ViT) ve ResNetRS50 tabanlı hibrit bir model geliştirilmiştir. ViT yüksek seviyeli anlamsal bilgileri, ResNetRS50 ise düşük ve orta seviyeli mekânsal özellikleri çıkarmakta; bu iki yapı, dikkat (attention) mekanizmaları ve Gated Fusion katmanı ile birleştirilmektedir. Eğitim sürecinde MixUp ve CutMix veri artırma yöntemleri, Focal Loss ile bilgi aktarımı (distillation) kaybı, OneCycleLR zamanlayıcı, otomatik karma hassasiyet (AMP) ve model ağırlıklarının üssel hareketli ortalaması (EMA) kullanılmıştır. Sekiz gemi sınıfından oluşan veri kümesi üzerinde yapılan deneyler, önerilen mimarinin hem doğruluk hem F1 skoru açısından tek başlı CNN veya ViT modellerinden daha yüksek performans gösterdiğini ortaya koymuştur. Sonuçlar, hibrit mimariler ve dikkat tabanlı füzyon stratejilerinin gemi sınıflandırma problemlerinde etkin bir çözüm sunduğunu göstermektedir.

Yüksek Lisans Tezleri

Browse

Filters

Settings

Sort By

Results per page

Search Results