A copy of this work was available on the public web and has been preserved in the Wayback Machine. The capture dates from 2017; you can also visit the original URL.
The file type is application/pdf
.
Filters
Klasifikasi dan Klastering Penjurusan Siswa SMA Negeri 3 Boyolali
2015
Khazanah Informatika
SMA N 3 Boyolali merupakan salah satu sekolah menengah di kota Boyolali yang saat ini telah memiliki 2 jurusan yaitu IPA dan IPS. Penjurusan siswa ini dapat mengarahkan peserta didik agar lebih fokus dalam mengembangkan kemampuan diri dan minat yang dimiliki. Pemilihan jurusan yang tidak tepat bisa sangat merugikan siswa terhadap minat dan karir mereka di masa mendatang. Dengan penjurusan tersebut diharapkan dapat memaksimalkan potensi, bakat atau talenta individu, sehingga dapat memaksimalkan
doi:10.23917/khif.v1i1.1175
fatcat:yzghp2jfdzdabit3rl2asl3ove
more »
... ilai akademisnya. Berdasarkan latar belakang tersebut, maka dengan menerapkan teknik data mining diharapkan dapat membantu siswa untuk menentukan jurusan yang tepat sesuai dengan kriteria yang ditetapkan. Adapaun teknik data mining yang digunakan dalam penentuan jurusan ini menggunakan 3 buah metode yaitu Algoritma C4.5, Naive Bayes dan Algoritma K-Means. Sedangkan atribut yang digunakan terdiri dari Gender, Minat, Rata-rata nilai IPA, Rata-rata nilai IPS, nilai Psikotest IPA, nilai Psikotest IPS, Asal Sekolah dan Jurusan. Analisis dilakukan dengan bantuan aplikasi RapidMiner 5 untuk mengetahui nilai-nilai perbandingan terhadap metode yang digunakan. Hasil penelitian menggunakan perbandingan 3 metode menunjukkan bahwa berdasarkan nilai precision, metode naive bayes lebih baik dibandingkan dengan metode yang lain dengan nilai 77,51%. Sedangkan berdasarkan nilai recall dan accuracy, decision tree lebih baik dibandingkan dengan metode yang lain dengan nilai recall sebesar 90,80% dan nilai accuracy sebesar 79,14%. Variabel yang paling berpengaruh dalam menentukan penjurusan yaitu rata-rata nilai IPA sehingga perlu dijadikan pertimbangan bagi pihak sekolah untuk menentukan jurusan siswa.
PREDIKSI RATING FILM MENGGUNAKAN METODE NAIVE BAYES
2016
Jurnal Teknik Elektro
Pada saat ini perkembangan dunia perfilman sudah sangat pesat, contohnya dengan banyaknya film-film yang silih berganti untuk ditayangkan, Para penikmat film juga membutuhkan film-film yang mempunyai kualitas gambar, suara, alur cerita dan nilai positif yang baik dalam sebuah film, agar mereka tetap antusias dalam mengikuti film-film yang terbaru. Namun film-film yang ada tidak semuanya dapat dinikmati dan tidak semua kalangan menyukai semua film. Agar suatu film dapat terus berkembang,
doaj:f7d6db258eb24a32b03815ab985f6901
fatcat:sr3dxlykjvcera6ctwn3zu37om
more »
... membutuhkan penilaian-penilaian dari para penikmat film, untuk mengetahui selera film yang sesuai dengan para penikmat film. Untuk itu dibutuhkan analisis agar dapat mengetahui bagaimana minat penikmat film yaitu dengan membuat penilaian-penilaian yang nantinya digunakan untuk mengetahui rating suatu film menggunakan metode nae bayes yaitu metode yang melakukan pendekatan statistika yang fundamental dalam pengenalan pola (pattern recognition). Pendekatan ini didasarkan pada kuantifikasi trade-off antara baerbagai keputusan klasifikasi dengan menggunakan probanilitas dan resiko yang ditimbulkan dalam keputusan-keputusan tersebut. Metode tersebut merupakan salah satu metode dari data mining, dengan atribut yang sudah ditentukan, yaitu meliputi genre film, aktor film, bahasa,warna, durasi film, negara, dan lainnya yang dapat digunakan sebagai tolak ukur sutradara untuk membuat film.
Klasifikasi Kanker Payudara Menggunakan Algoritma Gain Ratio
2016
Jurnal Teknik Elektro
Kanker payudara merupakan jenis kanker yang menempati urutan kedua sebagai penyakit yang paling umum ditemui. Seperlima dari wanita penderita kanker adalah mereka yang didiagnosa mengidap kanker payudara. Kanker secara umum dibagi dua yaitu jinak dan ganas, begitupun kanker payudara. Pada status ganas, kanker dapat berakibat buruk bagi penderitanya bila terlambat diketahui. Oleh sebab itu, deteksi dini pada penyakit kanker sangatlah penting agar penderitanya dapat menerima penanganan yang
doaj:6de40fded8b94809b49dbf7c287efeaf
fatcat:p6lxhiy5fjepjlghwp5qqnjmc4
more »
... Penelitian ini dilakukan dalam rangka untuk melakukan klasifikasi jenis kanker berdasarkan variable-variabel yang mempengaruhi menggunakan teknik data mining. Klasifikasi kanker payudara dilakukan menggunakan metode decision tree dengan algoritma gain ratio. Atribut-atribut yang digunakan dalam klasifikasi yaitu ketebalan rumpun, keseragaman ukuran sel, keseragaman bentuk sel, adhesi marjinal, ukuran sel epitel tunggal, ukuran asli nuclei, kromatin, keadaan nucleoli normal dan mitosis. Hasil evaluasi kinerja algoritma gain ratio diperoleh nilai recall, accuracy dan precision masing-masing sebesar 92,55%, 95,17% dan 93,76%. Nilai tersebut menunjukkan bahwa algoritma gain ratio sangat baik digunakan dalam klasifikasi ini. Berdasarkan skema decision tree, variabel keseragaman ukuran sel merupakan variable yang paling signifikan mempengaruhi jenis kanker.
PENGEMBANGAN MANAJEMEN DATA ELEKTRONIK PAUD DI PAC AISYIYAH KECAMATAN TINGKIR, SALATIGA
2015
Warta
Sistem Informasi Manajemen atau biasa disebut SIM menurut Nugroho (2008) adalah sistem yang diterapkan dalam organisasi untuk mendukung pengambilan keputusan dan informasi yang dihasilkan dapat berguna ...
doi:10.23917/warta.v18i2.1950
fatcat:z5ublkvxzfg6jezzavvgrji73y
Sistem Rekomendasi Pemilihan Sekolah Menengah Tingkat Atas Menggunakan Metode Naive Bayes
2016
Khazanah Informatika
Nugroho, dkk mengangkat masalah seleksi sekolah menengah lanjutan sebagai penelitiannya [6] . ...
doi:10.23917/khif.v2i2.2306
fatcat:qsvlw7yhtjg5dpwzqhdi46djky
KLASIFIKASI MASA STUDI MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA MENGGUNAKAN ALGORITMA C4.5
2017
Komuniti
Metode slovin dalam Nugroho (2009)
ditunjukkan pada persamaan 1. ...
doaj:e0f07ef5c8af4fd6a222bf5a4435c3bb
fatcat:6kkkrp6hjreolcngp4xcd7vcmm
PERKEMBANGAN PENGETAHUAN ANAK USIA DINI MELALUI PERMAINAN KOMPUTER EDUKATIF (Studi Kasus TK Aisyiyah 3 Salatiga)
2017
Komuniti
Children are currently have no spirit to learn and develop their creativities due to a conventional studying method they received. The research activity aims to know the influences of computer use in children intelligences and creativities. The activity was implemented to demonstrate the educative games. Each participant was given 1 game CD for installation. The result of the activity is analyzed using two types of questionnaire, before and after the socialization. The result indicates that
doaj:c5fc6d372b114b77b0d71c988f9387e7
fatcat:uajuwmgi6bguvawzzuxh5w4kja
more »
... uter technology has a huge affect to help children in knowledge development and intelligences. It can be seen from the comparison analysis of questionnaires which were distributed before and after the socialization.
How different are different diff algorithms in Git?
2019
Empirical Software Engineering
Automatic identification of the differences between two versions of a file is a common and basic task in several applications of mining code repositories. Git, a version control system, has a diff utility and users can select algorithms of diff from the default algorithm Myers to the advanced Histogram algorithm. From our systematic mapping, we identified three popular applications of diff in recent studies. On the impact on code churn metrics in 14 Java projects, we obtained different values
doi:10.1007/s10664-019-09772-z
fatcat:26anmxng2rejleexdzc35vi6em
more »
... 1.7% to 8.2% commits based on the different diff algorithms. Regarding bug-introducing change identification, we found 6.0% and 13.3% in the identified bug-fix commits had different results of bug-introducing changes from 10 Java projects. For patch application, we found that the Histogram is more suitable than Myers for providing the changes of code, from our manual analysis. Thus, we strongly recommend using the Histogram algorithm when mining Git repositories to consider differences in source code. Empirical Software Engineering (2020) 25:790-823 791
Sistem Klasifikasi Variabel Tingkat Penerimaan Konsumen Terhadap Mobil Menggunakan Metode Random Forest
2017
Jurnal Teknik Elektro
Saat ini tidak dapat dipungkiri bahwa persaingan pasar industri mobil di berbagai belahan dunia sangat ketat tak terkecuali di Indonesia. Indonesia memiliki industri manufaktur mobil terbesar kedua di Asia Tenggara setelah Thailand. Namun hasil statistik menunjukkan bahwa tingkat penjualan mobil di Indonesia masih belum stabil akibat tingkat penerimaan konsumen yang rendah. Ada banyak faktor yang mempengaruhi tingkat penerimaan konsumen terhadap produk-produk mobil yang baru diluncurkan. Jika
doaj:605565b9c208403cac810e32ee8b1350
fatcat:3gqnhk7o35cm5h43qmz73lwscm
more »
... l tersebut terus terjadi, akan berimbas buruk pada profitabilitas produsen mobil di negara ini. Untuk membantu mengurangi masalah tersebut, maka dibuat sebuah sistem untuk mengklasifikasi faktor yang mempengaruhi permasalahan tingkat penerimaan mobil oleh pihak konsumen. Faktor-faktor yang digunakan dalam sistem sebagai variabel yang mempengaruhi tingkat penerimaan konsumen terdiri dari harga pembelian, biaya perawatan, jumlah pintu, kapasitas penumpang, ukuran bagasi dan taksiran keselamatan penumpang. Sistem pengklasifikasi variabel ini dibangun dengan menerapkan metode Random Forest (RF). Pada metode ini, data maupun atribut diambil secara acak sehingga dimungkinkan akan menghasilkan berbagai model pohon keputusan. Adapun variabel yang menempati sebagai root node dalam pohon keputusan, merupakan variabel yang paling signifikan dalam mempengaruhi tingkat penerimaan mobil pada konsumen. Hasil dari sistem klasifikasi yang dibangun dapat dijadikan pertimbangan bagi produsen mobil di masa mendatang, sehingga produksi mobil menjadi lebih efektif, dapat meminimalisir kerugian dan meningkatkan profitabilitas produsen.
Implementasi Data Warehouse Dan Data Mining Untuk Pengembangan Sistem Rekomendasi Pemilihan SMA
2016
Khazanah Informatika
ABSTRAK Jumlah penyelenggara pendidikan di Sragen telah mengalami peningkatan dalam kurun beberapa tahun terakhir. Hal ini juga salah satu akibat dari semakin banyaknya jumlah siswa di wilayah tersebut. Namun peningkatan jumlah ini ternyata tidak diimbangi dengan pengelolaan data sekolah yang baik misalnya menggunakan teknologi informasi. Tidak adanya pusat data yang terintegrasi secara baik menyebabkan pihak sekolah kesulitan menyampaikan informasi akademik dan masyarakat sulit mendapatkan
doi:10.23917/khif.v2i2.2333
fatcat:ablcouf2svenfi7e25ictjw6ce
more »
... rmasi yang valid sehingga banyak calon siswa yang ragu untuk menentukan sekolah menengah tingkat atas yang akan dituju sesuai dengan kriterianya. Berdasarkan hal tersebut, sebuah data warehouse diperlukan sebagai pengelola data sekolah-sekolah secara terintegrasi dengan baik dan dikembangkan sistem rekomendasi dengan menerapkan teknik data mining. Dengan demikian, data sekolah dapat digali untuk menghasilkan suatu informasi yang dapat dimanfaatkan sebagai rekomendasi bagi calon siswa sekolah menengah atas untuk menentukan pilihan sekolah yang dituju. Sebuah diagram snowflake dirancang sebagai langkah awal dalam pengembangan data warehouse. Data yang dikirim ke data warehouse terlebih dahulu diproses melalui tahap ekstraksi, transformasi dan load. Sementara itu, sistem rekomendasi dibangun dengan menerapkan metode naïve bayes dengan cara menghitung probabilitas masing-masing kriteria yang diajukan berdasarkan data pelatihan dalam data warehouse. Adapun kriteria yang digunakan yaitu biaya sekolah, jarak sekolah, nilai akreditasi, tingkat kelulusan, dan nilai rerata ujian akhir nasional. Hasil penelitian menunjukkan bahwa sebuah data warehouse telah berhasil dibangun sebagai pengelola data sekolah di Sragen yang terintegrasi dan terhubung dengan sistem rekomendasi untuk membantu calon siswa memilih sekolah yang sesuai kriteria-kriteria yang diajukan. Rekomendasi yang dihasilkan oleh sistem berdasarkan nilai probabilitas tertinggi dari setiap variabel masing-masing sekolah, tingkat prioritas variabel, serta urutan rangking sekolah. Kata kunci: data mining, data warehouse, naive bayes, sistem rekomendasi sekolah KHAZANAH INFORMATIKA | Online
From Academia to Software Development: Publication Citations in Source Code Comments
[article]
2020
arXiv
pre-print
Academic publications have been evaluated in terms of their impact on research communities based on many metrics, such as the number of citations. On the other hand, the impact of academic publications on industry has been rarely studied. This paper investigates how academic publications contribute to software development by analyzing publication citations in source code comments in open source software repositories. We propose an automated approach for detecting academic publications based on
arXiv:1910.06932v2
fatcat:pwpdfws4bvdbnkcnp6lmkufy54
more »
... amed Entity Recognition, and achieve 0.90 in F_1 as detection accuracy. We conduct a large-scale study of publication citations with 319,438,977 comments collected from 25,925 active repositories written in seven programming languages. Our findings indicate that academic publications can be knowledge sources for software development. These referenced publications are particularly from journals. In terms of knowledge transfer, algorithm is the most prevalent type of knowledge transferred from the publications, with proposed formulas or equations typically implemented in methods or functions in source code files. In a closer look at GitHub repositories referencing academic publications, we find that science-related repositories are the most frequent among GitHub repositories with publication citations, and that the vast majority of these publications are referenced by repository owners who are different from the publication authors. We also find that referencing older publications can lead to potential issues related to obsolete knowledge.
Swapping-based Data Sanitization Method for Hiding Sensitive Frequent Itemset in Transaction Database
2021
International Journal of Advanced Computer Science and Applications
Sulistyo Nugroho, Maryam
Informatics Engineering Department
Universitas Muhammadiyah Surakarta ...
Sanitization Method for
Hiding Sensitive Frequent Itemset in Transaction
Database
Dedi Gunawan∗ , Yusuf ...
doi:10.14569/ijacsa.2021.0121179
fatcat:cgawuxi2pbbmrnevhgbj27vu6y
How Different Are Different diff Algorithms in Git?
[article]
2019
arXiv
pre-print
Automatic identification of the differences between two versions of a file is a common and basic task in several applications of mining code repositories. Git, a version control system, has a diff utility and users can select algorithms of diff from the default algorithm Myers to the advanced Histogram algorithm. From our systematic mapping, we identified three popular applications of diff in recent studies. On the impact on code churn metrics in 14 Java projects, we obtained different values
arXiv:1902.02467v3
fatcat:yc7oe7ypkjfwdiedkmyn32bqcy
more »
... 1.7% to 8.2% commits based on the different diff algorithms. Regarding bug-introducing change identification, we found 6.0% and 13.3% in the identified bug-fix commits had different results of bug-introducing changes from 10 Java projects. For patch application, we found that the Histogram is more suitable than Myers for providing the changes of code, from our manual analysis. Thus, we strongly recommend using the Histogram algorithm when mining Git repositories to consider differences in source code.
What network simulator questions do users ask? a large-scale study of stack overflow posts
2021
Indonesian Journal of Electrical Engineering and Computer Science
<span>The use of network simulator as a modern tool in analyzing and predicting the behaviour of computer networks has grown to reduce the complexity of its accuracy measurement. This growth of network simulator implementation have attracted the researchers and practitioners to share problems and discuss to improve the features. To communicate the issues relates to network simulators, users move to an online discussion platform, such as Stack Overflow. Although recent studies have shown the
doi:10.11591/ijeecs.v21.i3.pp1622-1633
fatcat:g53lj2a47fdgxkta23nsjgbznq
more »
... larity and benefits of adopting network simulation tools, however, the challenges of using network simulator that users face remain mostly unknown. Therefore, in this paper, we examine 2,322 network-simulator-related Stack Overflow posts to provide insights on the topics that users are interested and the challenges they face. We apply the Latent Dirichlet Allocation topic modeling to understand the topics that are being discussed in Stack Overflow. Then, we investigate the popularity and difficulty of each topic. The results of this study show that users use Stack Overflow as an implementation guideline for network simulation model. We determine 8 discussion topics that are merged into 5 major categories. Most of the posts discuss simulation model configuration. We also observe that target network protocol modification and network simulator installation are the most popular topics among the users compared to other topics. Users are specially facing challenges on network simulator installation and target network protocol modification issues.</span>
How are project-specific forums utilized? A study of participation, content, and sentiment in the Eclipse ecosystem
2021
Empirical Software Engineering
AbstractAlthough many software development projects have moved their developer discussion forums to generic platforms such as Stack Overflow, Eclipse has been steadfast in hosting their self-supported community forums. While recent studies show forums share similarities to generic communication channels, it is unknown how project-specific forums are utilized. In this paper, we analyze 832,058 forum threads and their linkages to four systems with 2,170 connected contributors to understand the
doi:10.1007/s10664-021-10032-2
fatcat:fzqttukrenanjmssksvkeunsxa
more »
... ticipation, content and sentiment. Results show that Seniors are the most active participants to respond bug and non-bug-related threads in the forums (i.e., 66.1% and 45.5%), and sentiment among developers are inconsistent while knowledge sharing within Eclipse. We recommend the users to identify appropriate topics and ask in a positive procedural way when joining forums. For developers, preparing project-specific forums could be an option to bridge the communication between members. Irrespective of the popularity of Stack Overflow, we argue the benefits of using project-specific forum initiatives, such as GitHub Discussions, are needed to cultivate a community and its ecosystem.
« Previous
Showing results 1 — 15 out of 54 results