Filters








54 Hits in 1.8 sec

Klasifikasi dan Klastering Penjurusan Siswa SMA Negeri 3 Boyolali

Yusuf Sulistyo Nugroho
2015 Khazanah Informatika  
SMA N 3 Boyolali merupakan salah satu sekolah menengah di kota Boyolali yang saat ini telah memiliki 2 jurusan yaitu IPA dan IPS. Penjurusan siswa ini dapat mengarahkan peserta didik agar lebih fokus dalam mengembangkan kemampuan diri dan minat yang dimiliki. Pemilihan jurusan yang tidak tepat bisa sangat merugikan siswa terhadap minat dan karir mereka di masa mendatang. Dengan penjurusan tersebut diharapkan dapat memaksimalkan potensi, bakat atau talenta individu, sehingga dapat memaksimalkan
more » ... ilai akademisnya. Berdasarkan latar belakang tersebut, maka dengan menerapkan teknik data mining diharapkan dapat membantu siswa untuk menentukan jurusan yang tepat sesuai dengan kriteria yang ditetapkan. Adapaun teknik data mining yang digunakan dalam penentuan jurusan ini menggunakan 3 buah metode yaitu Algoritma C4.5, Naive Bayes dan Algoritma K-Means. Sedangkan atribut yang digunakan terdiri dari Gender, Minat, Rata-rata nilai IPA, Rata-rata nilai IPS, nilai Psikotest IPA, nilai Psikotest IPS, Asal Sekolah dan Jurusan. Analisis dilakukan dengan bantuan aplikasi RapidMiner 5 untuk mengetahui nilai-nilai perbandingan terhadap metode yang digunakan. Hasil penelitian menggunakan perbandingan 3 metode menunjukkan bahwa berdasarkan nilai precision, metode naive bayes lebih baik dibandingkan dengan metode yang lain dengan nilai 77,51%. Sedangkan berdasarkan nilai recall dan accuracy, decision tree lebih baik dibandingkan dengan metode yang lain dengan nilai recall sebesar 90,80% dan nilai accuracy sebesar 79,14%. Variabel yang paling berpengaruh dalam menentukan penjurusan yaitu rata-rata nilai IPA sehingga perlu dijadikan pertimbangan bagi pihak sekolah untuk menentukan jurusan siswa.
doi:10.23917/khif.v1i1.1175 fatcat:yzghp2jfdzdabit3rl2asl3ove

PREDIKSI RATING FILM MENGGUNAKAN METODE NAIVE BAYES

Riszki Wijayatun Pratiwi, Yusuf Sulistyo Nugroho
2016 Jurnal Teknik Elektro  
Pada saat ini perkembangan dunia perfilman sudah sangat pesat, contohnya dengan banyaknya film-film yang silih berganti untuk ditayangkan, Para penikmat film juga membutuhkan film-film yang mempunyai kualitas gambar, suara, alur cerita dan nilai positif yang baik dalam sebuah film, agar mereka tetap antusias dalam mengikuti film-film yang terbaru. Namun film-film yang ada tidak semuanya dapat dinikmati dan tidak semua kalangan menyukai semua film. Agar suatu film dapat terus berkembang,
more » ... membutuhkan penilaian-penilaian dari para penikmat film, untuk mengetahui selera film yang sesuai dengan para penikmat film. Untuk itu dibutuhkan analisis agar dapat mengetahui bagaimana minat penikmat film yaitu dengan membuat penilaian-penilaian yang nantinya digunakan untuk mengetahui rating suatu film menggunakan metode nae bayes yaitu metode yang melakukan pendekatan statistika yang fundamental dalam pengenalan pola (pattern recognition). Pendekatan ini didasarkan pada kuantifikasi trade-off antara baerbagai keputusan klasifikasi dengan menggunakan probanilitas dan resiko yang ditimbulkan dalam keputusan-keputusan tersebut. Metode tersebut merupakan salah satu metode dari data mining, dengan atribut yang sudah ditentukan, yaitu meliputi genre film, aktor film, bahasa,warna, durasi film, negara, dan lainnya yang dapat digunakan sebagai tolak ukur sutradara untuk membuat film.
doaj:f7d6db258eb24a32b03815ab985f6901 fatcat:sr3dxlykjvcera6ctwn3zu37om

Klasifikasi Kanker Payudara Menggunakan Algoritma Gain Ratio

Balqis Aisyah Farahdiba, Yusuf Sulistyo Nugroho
2016 Jurnal Teknik Elektro  
Kanker payudara merupakan jenis kanker yang menempati urutan kedua sebagai penyakit yang paling umum ditemui. Seperlima dari wanita penderita kanker adalah mereka yang didiagnosa mengidap kanker payudara. Kanker secara umum dibagi dua yaitu jinak dan ganas, begitupun kanker payudara. Pada status ganas, kanker dapat berakibat buruk bagi penderitanya bila terlambat diketahui. Oleh sebab itu, deteksi dini pada penyakit kanker sangatlah penting agar penderitanya dapat menerima penanganan yang
more » ... Penelitian ini dilakukan dalam rangka untuk melakukan klasifikasi jenis kanker berdasarkan variable-variabel yang mempengaruhi menggunakan teknik data mining. Klasifikasi kanker payudara dilakukan menggunakan metode decision tree dengan algoritma gain ratio. Atribut-atribut yang digunakan dalam klasifikasi yaitu ketebalan rumpun, keseragaman ukuran sel, keseragaman bentuk sel, adhesi marjinal, ukuran sel epitel tunggal, ukuran asli nuclei, kromatin, keadaan nucleoli normal dan mitosis. Hasil evaluasi kinerja algoritma gain ratio diperoleh nilai recall, accuracy dan precision masing-masing sebesar 92,55%, 95,17% dan 93,76%. Nilai tersebut menunjukkan bahwa algoritma gain ratio sangat baik digunakan dalam klasifikasi ini. Berdasarkan skema decision tree, variabel keseragaman ukuran sel merupakan variable yang paling signifikan mempengaruhi jenis kanker.
doaj:6de40fded8b94809b49dbf7c287efeaf fatcat:p6lxhiy5fjepjlghwp5qqnjmc4

PENGEMBANGAN MANAJEMEN DATA ELEKTRONIK PAUD DI PAC AISYIYAH KECAMATAN TINGKIR, SALATIGA

Yusuf Sulistyo Nugroho
2015 Warta  
Sistem Informasi Manajemen atau biasa disebut SIM menurut Nugroho (2008) adalah sistem yang diterapkan dalam organisasi untuk mendukung pengambilan keputusan dan informasi yang dihasilkan dapat berguna  ... 
doi:10.23917/warta.v18i2.1950 fatcat:z5ublkvxzfg6jezzavvgrji73y

Sistem Rekomendasi Pemilihan Sekolah Menengah Tingkat Atas Menggunakan Metode Naive Bayes

Triana Dewi Salma, Yusuf Sulistyo Nugroho
2016 Khazanah Informatika  
Nugroho, dkk mengangkat masalah seleksi sekolah menengah lanjutan sebagai penelitiannya [6] .  ... 
doi:10.23917/khif.v2i2.2306 fatcat:qsvlw7yhtjg5dpwzqhdi46djky

KLASIFIKASI MASA STUDI MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA MENGGUNAKAN ALGORITMA C4.5

Yusuf Sulistyo Nugroho
2017 Komuniti  
Metode slovin dalam Nugroho (2009) ditunjukkan pada persamaan 1.  ... 
doaj:e0f07ef5c8af4fd6a222bf5a4435c3bb fatcat:6kkkrp6hjreolcngp4xcd7vcmm

PERKEMBANGAN PENGETAHUAN ANAK USIA DINI MELALUI PERMAINAN KOMPUTER EDUKATIF (Studi Kasus TK Aisyiyah 3 Salatiga)

Yusuf Sulistyo Nugroho
2017 Komuniti  
Children are currently have no spirit to learn and develop their creativities due to a conventional studying method they received. The research activity aims to know the influences of computer use in children intelligences and creativities. The activity was implemented to demonstrate the educative games. Each participant was given 1 game CD for installation. The result of the activity is analyzed using two types of questionnaire, before and after the socialization. The result indicates that
more » ... uter technology has a huge affect to help children in knowledge development and intelligences. It can be seen from the comparison analysis of questionnaires which were distributed before and after the socialization.
doaj:c5fc6d372b114b77b0d71c988f9387e7 fatcat:uajuwmgi6bguvawzzuxh5w4kja

How different are different diff algorithms in Git?

Yusuf Sulistyo Nugroho, Hideaki Hata, Kenichi Matsumoto
2019 Empirical Software Engineering  
Automatic identification of the differences between two versions of a file is a common and basic task in several applications of mining code repositories. Git, a version control system, has a diff utility and users can select algorithms of diff from the default algorithm Myers to the advanced Histogram algorithm. From our systematic mapping, we identified three popular applications of diff in recent studies. On the impact on code churn metrics in 14 Java projects, we obtained different values
more » ... 1.7% to 8.2% commits based on the different diff algorithms. Regarding bug-introducing change identification, we found 6.0% and 13.3% in the identified bug-fix commits had different results of bug-introducing changes from 10 Java projects. For patch application, we found that the Histogram is more suitable than Myers for providing the changes of code, from our manual analysis. Thus, we strongly recommend using the Histogram algorithm when mining Git repositories to consider differences in source code. Empirical Software Engineering (2020) 25:790-823 791
doi:10.1007/s10664-019-09772-z fatcat:26anmxng2rejleexdzc35vi6em

Sistem Klasifikasi Variabel Tingkat Penerimaan Konsumen Terhadap Mobil Menggunakan Metode Random Forest

Yusuf Sulistyo Nugroho, Nova Emiliyawati
2017 Jurnal Teknik Elektro  
Saat ini tidak dapat dipungkiri bahwa persaingan pasar industri mobil di berbagai belahan dunia sangat ketat tak terkecuali di Indonesia. Indonesia memiliki industri manufaktur mobil terbesar kedua di Asia Tenggara setelah Thailand. Namun hasil statistik menunjukkan bahwa tingkat penjualan mobil di Indonesia masih belum stabil akibat tingkat penerimaan konsumen yang rendah. Ada banyak faktor yang mempengaruhi tingkat penerimaan konsumen terhadap produk-produk mobil yang baru diluncurkan. Jika
more » ... l tersebut terus terjadi, akan berimbas buruk pada profitabilitas produsen mobil di negara ini. Untuk membantu mengurangi masalah tersebut, maka dibuat sebuah sistem untuk mengklasifikasi faktor yang mempengaruhi permasalahan tingkat penerimaan mobil oleh pihak konsumen. Faktor-faktor yang digunakan dalam sistem sebagai variabel yang mempengaruhi tingkat penerimaan konsumen terdiri dari harga pembelian, biaya perawatan, jumlah pintu, kapasitas penumpang, ukuran bagasi dan taksiran keselamatan penumpang. Sistem pengklasifikasi variabel ini dibangun dengan menerapkan metode Random Forest (RF). Pada metode ini, data maupun atribut diambil secara acak sehingga dimungkinkan akan menghasilkan berbagai model pohon keputusan. Adapun variabel yang menempati sebagai root node dalam pohon keputusan, merupakan variabel yang paling signifikan dalam mempengaruhi tingkat penerimaan mobil pada konsumen. Hasil dari sistem klasifikasi yang dibangun dapat dijadikan pertimbangan bagi produsen mobil di masa mendatang, sehingga produksi mobil menjadi lebih efektif, dapat meminimalisir kerugian dan meningkatkan profitabilitas produsen.
doaj:605565b9c208403cac810e32ee8b1350 fatcat:3gqnhk7o35cm5h43qmz73lwscm

Implementasi Data Warehouse Dan Data Mining Untuk Pengembangan Sistem Rekomendasi Pemilihan SMA

Yusuf Sulistyo Nugroho, Triana Dewi Salma, Sigid Rokhanuddin
2016 Khazanah Informatika  
ABSTRAK Jumlah penyelenggara pendidikan di Sragen telah mengalami peningkatan dalam kurun beberapa tahun terakhir. Hal ini juga salah satu akibat dari semakin banyaknya jumlah siswa di wilayah tersebut. Namun peningkatan jumlah ini ternyata tidak diimbangi dengan pengelolaan data sekolah yang baik misalnya menggunakan teknologi informasi. Tidak adanya pusat data yang terintegrasi secara baik menyebabkan pihak sekolah kesulitan menyampaikan informasi akademik dan masyarakat sulit mendapatkan
more » ... rmasi yang valid sehingga banyak calon siswa yang ragu untuk menentukan sekolah menengah tingkat atas yang akan dituju sesuai dengan kriterianya. Berdasarkan hal tersebut, sebuah data warehouse diperlukan sebagai pengelola data sekolah-sekolah secara terintegrasi dengan baik dan dikembangkan sistem rekomendasi dengan menerapkan teknik data mining. Dengan demikian, data sekolah dapat digali untuk menghasilkan suatu informasi yang dapat dimanfaatkan sebagai rekomendasi bagi calon siswa sekolah menengah atas untuk menentukan pilihan sekolah yang dituju. Sebuah diagram snowflake dirancang sebagai langkah awal dalam pengembangan data warehouse. Data yang dikirim ke data warehouse terlebih dahulu diproses melalui tahap ekstraksi, transformasi dan load. Sementara itu, sistem rekomendasi dibangun dengan menerapkan metode naïve bayes dengan cara menghitung probabilitas masing-masing kriteria yang diajukan berdasarkan data pelatihan dalam data warehouse. Adapun kriteria yang digunakan yaitu biaya sekolah, jarak sekolah, nilai akreditasi, tingkat kelulusan, dan nilai rerata ujian akhir nasional. Hasil penelitian menunjukkan bahwa sebuah data warehouse telah berhasil dibangun sebagai pengelola data sekolah di Sragen yang terintegrasi dan terhubung dengan sistem rekomendasi untuk membantu calon siswa memilih sekolah yang sesuai kriteria-kriteria yang diajukan. Rekomendasi yang dihasilkan oleh sistem berdasarkan nilai probabilitas tertinggi dari setiap variabel masing-masing sekolah, tingkat prioritas variabel, serta urutan rangking sekolah. Kata kunci: data mining, data warehouse, naive bayes, sistem rekomendasi sekolah KHAZANAH INFORMATIKA | Online
doi:10.23917/khif.v2i2.2333 fatcat:ablcouf2svenfi7e25ictjw6ce

From Academia to Software Development: Publication Citations in Source Code Comments [article]

Akira Inokuchi, Yusuf Sulistyo Nugroho, Supatsara Wattanakriengkrai, Fumiaki Konishi, Hideaki Hata, Christoph Treude, Akito Monden, Kenichi Matsumoto
2020 arXiv   pre-print
Academic publications have been evaluated in terms of their impact on research communities based on many metrics, such as the number of citations. On the other hand, the impact of academic publications on industry has been rarely studied. This paper investigates how academic publications contribute to software development by analyzing publication citations in source code comments in open source software repositories. We propose an automated approach for detecting academic publications based on
more » ... amed Entity Recognition, and achieve 0.90 in F_1 as detection accuracy. We conduct a large-scale study of publication citations with 319,438,977 comments collected from 25,925 active repositories written in seven programming languages. Our findings indicate that academic publications can be knowledge sources for software development. These referenced publications are particularly from journals. In terms of knowledge transfer, algorithm is the most prevalent type of knowledge transferred from the publications, with proposed formulas or equations typically implemented in methods or functions in source code files. In a closer look at GitHub repositories referencing academic publications, we find that science-related repositories are the most frequent among GitHub repositories with publication citations, and that the vast majority of these publications are referenced by repository owners who are different from the publication authors. We also find that referencing older publications can lead to potential issues related to obsolete knowledge.
arXiv:1910.06932v2 fatcat:pwpdfws4bvdbnkcnp6lmkufy54

Swapping-based Data Sanitization Method for Hiding Sensitive Frequent Itemset in Transaction Database

Dedi Gunawan, Yusuf Sulistyo Nugroho, Maryam -
2021 International Journal of Advanced Computer Science and Applications  
Sulistyo Nugroho, Maryam Informatics Engineering Department Universitas Muhammadiyah Surakarta  ...  Sanitization Method for Hiding Sensitive Frequent Itemset in Transaction Database Dedi Gunawan∗ , Yusuf  ... 
doi:10.14569/ijacsa.2021.0121179 fatcat:cgawuxi2pbbmrnevhgbj27vu6y

How Different Are Different diff Algorithms in Git? [article]

Yusuf Sulistyo Nugroho, Hideaki Hata, Kenichi Matsumoto
2019 arXiv   pre-print
Automatic identification of the differences between two versions of a file is a common and basic task in several applications of mining code repositories. Git, a version control system, has a diff utility and users can select algorithms of diff from the default algorithm Myers to the advanced Histogram algorithm. From our systematic mapping, we identified three popular applications of diff in recent studies. On the impact on code churn metrics in 14 Java projects, we obtained different values
more » ... 1.7% to 8.2% commits based on the different diff algorithms. Regarding bug-introducing change identification, we found 6.0% and 13.3% in the identified bug-fix commits had different results of bug-introducing changes from 10 Java projects. For patch application, we found that the Histogram is more suitable than Myers for providing the changes of code, from our manual analysis. Thus, we strongly recommend using the Histogram algorithm when mining Git repositories to consider differences in source code.
arXiv:1902.02467v3 fatcat:yc7oe7ypkjfwdiedkmyn32bqcy

What network simulator questions do users ask? a large-scale study of stack overflow posts

Syful Islam, Yusuf Sulistyo Nugroho, Md. Javed Hoss
2021 Indonesian Journal of Electrical Engineering and Computer Science  
<span>The use of network simulator as a modern tool in analyzing and predicting the behaviour of computer networks has grown to reduce the complexity of its accuracy measurement. This growth of network simulator implementation have attracted the researchers and practitioners to share problems and discuss to improve the features. To communicate the issues relates to network simulators, users move to an online discussion platform, such as Stack Overflow. Although recent studies have shown the
more » ... larity and benefits of adopting network simulation tools, however, the challenges of using network simulator that users face remain mostly unknown. Therefore, in this paper, we examine 2,322 network-simulator-related Stack Overflow posts to provide insights on the topics that users are interested and the challenges they face. We apply the Latent Dirichlet Allocation topic modeling to understand the topics that are being discussed in Stack Overflow. Then, we investigate the popularity and difficulty of each topic. The results of this study show that users use Stack Overflow as an implementation guideline for network simulation model. We determine 8 discussion topics that are merged into 5 major categories. Most of the posts discuss simulation model configuration. We also observe that target network protocol modification and network simulator installation are the most popular topics among the users compared to other topics. Users are specially facing challenges on network simulator installation and target network protocol modification issues.</span>
doi:10.11591/ijeecs.v21.i3.pp1622-1633 fatcat:g53lj2a47fdgxkta23nsjgbznq

How are project-specific forums utilized? A study of participation, content, and sentiment in the Eclipse ecosystem

Yusuf Sulistyo Nugroho, Syful Islam, Keitaro Nakasai, Ifraz Rehman, Hideaki Hata, Raula Gaikovina Kula, Meiyappan Nagappan, Kenichi Matsumoto
2021 Empirical Software Engineering  
AbstractAlthough many software development projects have moved their developer discussion forums to generic platforms such as Stack Overflow, Eclipse has been steadfast in hosting their self-supported community forums. While recent studies show forums share similarities to generic communication channels, it is unknown how project-specific forums are utilized. In this paper, we analyze 832,058 forum threads and their linkages to four systems with 2,170 connected contributors to understand the
more » ... ticipation, content and sentiment. Results show that Seniors are the most active participants to respond bug and non-bug-related threads in the forums (i.e., 66.1% and 45.5%), and sentiment among developers are inconsistent while knowledge sharing within Eclipse. We recommend the users to identify appropriate topics and ask in a positive procedural way when joining forums. For developers, preparing project-specific forums could be an option to bridge the communication between members. Irrespective of the popularity of Stack Overflow, we argue the benefits of using project-specific forum initiatives, such as GitHub Discussions, are needed to cultivate a community and its ecosystem.
doi:10.1007/s10664-021-10032-2 fatcat:fzqttukrenanjmssksvkeunsxa
« Previous Showing results 1 — 15 out of 54 results