DATA CLEANING AS ONE OF THE METHODS OF DATA PROCESSING FOR CRIMINAL INVESTIGATIONS
L.A. Korostelova
2022
Ûridičnij naukovij elektronnij žurnal
Коростельова Л.А., ад'юнктка кафедри кримінально-правових дисциплін Луганський державний університет внутрішніх справ імені Е.О. Дідоренка У статті розглянуто один із інноваційних методів обробки даних Data cleaning. Визначені проблемні питання, що виникають у кримінології під час обробки даних для досліджень. Надано поняття очищення даних і його використання в контексті науки про дані, зокрема і в кримінологічній науці. Описано етапи процесу очищення даних. Визначено, що очищення даних
more »
... ся основоположним елементом основ науки про дані, оскільки відіграє важливу роль в аналітичному процесі та пошуку надійних відповідей. Запропоновано та розглянуто концепції очищення даних для кримінологічних досліджень. Проведено аналіз методів і технологій очищення даних на кожному із етапів процесу з врахуванням його особливостей для кримінологічної науки. Побудована процедура очищення даних для систематизації методів у реалізації моделі для кримінологічного дослідження. Якість персональних даних є проблемою, що значно знижує результативність аналізу. Визначена авторська думка, щодо застосування спеціалізованих інструментів і методів, що дають змогу перетворити зібрані «сирі» дані у цінну інформацію, що використовується в процесі кримінологічної розвідки. Обґрунтовано висновок, що метод очищення даних (Data cleaning) для кримінологічної науки, і зокрема для кримінологічних досліджень має перспективний напрям. У висновках обґрунтовано запропоновані зміни для вдосконалення кримінологічної науки. А також визначено і сформовано критерії підбору алгоритмів очищення даних від випадково виникаючих помилок в процесі отримання даних. Рекомендовано використання шаблонів обробки на основі сформованих метаданих вхідного потоку для використання вже розрахованих алгоритмів очищення. У подальшій роботі буде розглянуто більш ефективне формування метаданих, їх формат та зберігання. У статті доведено, що інноваційний метод очищення даних (Data cleaning) потребує впровадження і подальшого розвитку у кримінологічній науці, зокрема і для кримінологічних досліджень, а також для перепідготовки кримінологів на новий рівень розвитку. Ключові слова: Data cleaning, методи кримінології, кримінологічні дослідження, наука про дані, метадані. The article considers one of the innovative data processing methods -Data cleaning. The problematic issues that arise in criminology during data processing for research are identified. The concept of data purification and its use in the context of data science, in particular in criminology, is given. The stages of the data cleaning process are described. It is determined that data cleaning is considered a fundamental element of the foundations of data science, as it plays an important role in the analytical process and the search for reliable answers. Concepts of data cleaning for criminal investigations are offered and considered. The analysis of methods and technologies of data cleaning at each stage of the process and its features for criminology is carried out. The procedure of data cleaning for the systematization of methods in the realization of a model for criminal investigations is constructed. The quality of personal data is a problem that significantly reduces the effectiveness of the analysis. The author's opinion on the use of specialized tools and methods that allow transforming the collected "raw" data into valuable information used in the process of criminal intelligence is defined. The conclusion that the method of data cleaning for criminology, and in particular for criminal investigations has a promising direction, is substantiated. The conclusions substantiate the proposed changes to improve criminology as a science. Also, the criteria for selecting algorithms for cleaning data from accidental errors in the process of obtaining data are defined and formulated. It is recommended to use processing templates based on the generated input data metadata to use the already calculated cleaning algorithms. Further work will involve considering of more efficient formation of metadata, their format, and storage. The article proves that the innovative method of data cleaning requires the introduction and further development in criminology, in particular for criminal investigations, as well as for the retraining of criminologists for a new level of development.
doi:10.32782/2524-0374/2022-5/136
fatcat:m7pkgblc3fcuharnp7lfzkzwwq