A comparison of machine learning techniques for the detection of microplastics

Linda Schedl

doi:10.34726/hss.2020.75743

0

Article ? AI-assigned paper type based on the abstract. Classification may not be perfect — flag errors using the feedback button. Tier 2 ? Original research — experimental, observational, or case-control study. Direct primary evidence. Detection Methods Sign in to save

A comparison of machine learning techniques for the detection of microplastics

Original title: A comparison of machine learning techniques for the detection of microplastics

reposiTUm (TU Wien) 2020

Linda Schedl

Summary

This German-language study compared machine learning algorithms for classifying microplastics based on their infrared spectra, finding that several methods could reliably distinguish polymer types. Automating microplastic identification through machine learning could greatly increase the speed and throughput of environmental monitoring.

Mikroplastik ist nicht nur in Meer- und Abwasser gefunden worden, sondern auch in Frisch- und Trinkwasser. Die Analyse dieser Plastikpartikeln beinhaltet die Probenentnahme und deren Aufarbeitung im Labor sowie die abschließende Identifikation. Fourier-Transform-Infrarot (FTIR) Spektren können dazu verwendet werden, um Mikroplastik zu charakterisieren, indem sie mit Hilfe von Maschinellem Lernen klassifiziert werden. Die Python-Bibliothek Scikit-learn bietet eine Vielzahl an Methoden für diesen Bereich. Außerdem kann die Software ImageLab verwendet werden, um FTIR Spektren von Mikroplastik zu klassifizieren.Drei verschiedene Algorithmen für die Klassifizierung von Mikroplastik wurden in dieser Arbeit miteinander verglichen. Im Speziellen wurden k Nearest Neighbors (kNN) und Support Vector Machine (SVM) Klassifikatoren mit Hilfe von Scikit-learn implementiert. Das Training der kNN und SVM Klassifikatoren beinhaltet auch eine Hyper-Parameter Optimierung, um die besten Einstellungen für den Algorithmus zu finden. Außerdem wurden noch die in ImageLab bereits vorhandenen Random Decision Forest (RDF) Klassifikatoren ausgewertet.Die Genauigkeit und der Matthews Korrelationskoeffizient des RDF zeigten ähnliche Werte wie SVM und waren nur geringfügig besser als bei kNN. SVM weist lange Trainingszeiten auf und kNN lange Anwendungszeiten. Der erstgenannte Punkt ist nur ein kleineres Problem, da das Training nur einmal durchgeführt werden muss. Der zweitgenannte Punkt limitiert jedoch kNN in der praktischen Anwendung, da dort oft sehr große Datenmengen analysiert werden müssen.Die Klassifikation von Mischspektren zeigte, dass kNN und SVM dazu tendieren, einzelne Pixel verschiedenen Klassen zuzuordnen, die tatsächlich gar nicht vorhanden sind. Im Gegensatz dazu, weist der RDF Klassifikator nur die beiden vorhandenen Polymer-Klassen oder die Non-Polymer-Klasse zu. Diese falsch klassifizierten Pixel bei kNN und SVM können möglicherweise durch die Nachverarbeitung verhindert werden. Dabei wird die Ausgabe der binären Klassifikatoren weiterverarbeitet anstatt nur die wahrscheinlichste Klasse zuzuordnen.

Read via DOI Download PDF

Share this paper

Post Share Share Pin Email