Metody i narzędzia weryfikacji rzetelności danych liczbowych
Ładowanie...
Data wydania
2016
Tytuł czasopisma
ISSN
eISSN
Tytuł tomu
ISBN
978-83-65208-69-9
eISBN
Wydawca
Oficyna Wydawnicza AFM
Abstrakt
W pracy przedstawiono problematykę rozkładu cyfr znaczących w dużych
zbiorach danych liczbowych pochodzących z pomiaru. Empiryczne rozkłady
cyfr znaczących opisane są funkcjami matematycznymi ze ściśle sprecyzowanymi
parametrami. Odstępstwo rozkładów empirycznych od rozkładów
teoretycznych może oznaczać, że analizowany zbiór danych liczbowych zawiera
niewiarygodne informacje. Szczegółowa analiza rozbieżności pozwala
ponadto wskazać, które dane są najmniej wiarygodne.
Narzędzia analizy rozkładów cyfr znaczących są użyteczne w każdych
badaniach empirycznych, gdyż rzetelność danych źródłowych ma fundamentalne
znaczenie dla poprawności wniosków wynikających z przeprowadzanych
analiz. Prezentowana praca zawiera charakterystykę metod
i procedur weryfikacji danych podaną w przystępny sposób i zilustrowaną
praktycznymi przykładami.
W rozdziale pierwszym przedstawiono genezę i historię odkryć naukowych
związanych z szeroko rozumianymi prawami liczbowymi, m.in. regułę
Pareto, ciągi Fibonacciego i Lukasa, prawa Estoupa, Zipfa, Heapsa oraz
prawa Newcomba-Benforda.
Szczegółowe omówienie rozkładów cyfr znaczących, testów i mierników
służących do oceny stopnia zbieżności rozkładów empirycznych z rozkładami
teoretycznymi przytoczone jest w rozdziale drugim. Zamieszczono tu
również uzasadnienie teoretyczne praw rządzących rozkładami pierwszych,
drugich i kolejnych cyfr znaczących a także rozkładów uogólnionych i alternatywnych.
Rozdział trzeci ma charakter narzędziowy i zawiera opis dostępnych
w Internecie, darmowych aplikacji komputerowych wykorzystywanych
w procedurach analitycznych związanych z prawami Benforda rozkładu cyfr
znaczących. Są to m.in. programy: EZ-R Stats for Excel, Web Computer Assisted
Audit Tool (Web CAAT), Digital Analysis Tests and Statistics (DATAS),
Benford’s Law Utility,
W kolejnym, czwartym rozdziale przedstawiono autorskie narzędzie
analizy danych wykorzystujące makroinstrukcje arkusza kalkulacyjnego do realizacji ciągu obliczeń zgodnie z omówionymi wcześniej procedurami.
Aplikacja ta udostępniona jest na stronie www.benford.pl i pozwala przeprowadzać
złożone obliczenia w sposób maksymalnie zautomatyzowany.
Ostatni, piąty rozdział zawiera przykład pełnej analizy zbioru danych
dotyczących blisko 6 tys. faktur zakupowych apteki X. Analizę przeprowadzono
przy pomocy narzędzia omówionego w rozdziale czwartym wykorzystując
rozkład pierwszej (F1), drugiej (D2), trzeciej (D3), dwóch pierwszych
(F2), trzech pierwszych (F3) oraz ostatniej (L1) cyfry znaczącej.
Reasumując, praca stanowi użyteczne narzędzie praktyczne w zakresie
infometrii, zajmującej się oceną i poprawą jakości informacji. Narzędzia
wypracowane w ramach tej dyscypliny stosowane są w różnych obszarach
dziedzinowych takich jak: naukometria, bibliometria, infobrokering, webometria
itd.
Metody omówione w pracy mogą też być wykorzystane w e-learningu,
zwłaszcza w procedurach weryfikujących poprawność sprawdzianów wiedzy
czy też do oceny wiarygodności opinii studentów pozyskiwanych w trakcie
ewaluacji kursów e-learningowych. W dalszych badaniach przewiduje się
wdrożenie procedur omówionych w niniejszej monografii do szeroko rozumianej
polityki podnoszenia jakości kształcenia w formie e-learningowej.
Opis
Praca recenzowana / Peer-reviewed paper
Tematy
Słowa kluczowe
prawa liczbowe, prawo Benforda, taksonometria, infometria, rozkład Benforda, rozkład cyfr znaczących, systemy informatyczne, optymalizacja matematyczna