Zpracování a prezentace dat

bavíme se vzděláním

Vítáme vás u sedmého týdne Letní výzvy 2022, kde budeme mluvit o velmi důležité části vašich závěrečných prací. Autoři mnohých bakalářských a diplomových prací sbírají výzkumná data (ať už pomocí dotazníku, měření, experimentu nebo využívají sekundární data třeba z Českého statistického úřadu), dále je určitým způsobem zpracovávají a výsledky uvádějí v praktické části nebo například v kapitole „Výsledky a diskuse”. Jenže i v této části, kde jsou standardizovány metody a postupy, se dělají občas chyby ve velmi jednoduchých záležitostech, jako jsou grafy nebo tabulky. Dnes si připomeneme, jaké metody byste mohli využít a jakým chybám je dobré se vyhnout.

Obsah

Typ výzkumu a data

Na začátku si ujasníme, jaký výzkum provádíme a s jakým typem dat pracujeme. Pomocí sběru, zpracování dat a odvození závěru přispíváte k naplnění cíle vaší závěrečné práce, a to bez ohledu na to, jestli děláte kvalitativní nebo kvantitativní výzkum. Jenže pro každý typ dat máme osvědčené metody, a navíc sama formulace výzkumné otázky, resp. pokud jste dělali specifické výzkumné otázky, vás již může navést na to, jakým způsobem budete data zpracovávat.

Důležité je, s jakými daty pracujete – jestli je sbíráte sami ve formě primárních dat nebo využíváte sekundární data.

Pokud zkoumáte sekundární data ve formě například údajů makroekonomických ukazatelů, pořídíte si je z příslušné důvěryhodné databáze (ČSÚ, OECD apod.), a máte větší jistotu, že jsou validní a kvalitní. Poté stačí data vhodným způsobem zpracovat a interpretovat. Tady bychom podotkli, že nebudete pracovat s unikátní datovou sadou ( přístup k těmto datům bude mít více lidí). Vaše práce má mít přidanou (vědeckou) hodnotu a většinou nestačí opakovat to, co už bylo Xkrát uděláno jinými studenty. Vzhledem k dobré reliabilitě statistických metod pravděpodobně dostanete stejné výsledky. Takovou typickou chybou může být, že v praktické části student využije například graf vývoje nějakého ukazatele v čase, který dokonce okopíruje z cizího zdroje, aniž by se pokusil o vlastní zpracování časové řady, jednoduše slovně ten graf popíše a považuje to za vlastní výsledek své práce. Realita je však taková, že závěrečná práce na vysoké škole je o něčem sofistikovanějším, než je jednoduchý popis cizích výsledků. Tak si pozorně rozmyslete, co bude tou vaší přidanou hodnotou – využití pokročilejších metod, nové přístupy k modelování, sofistikovaná interpretace výsledků nebo komparace s jinými výzkumy. V každé práci má být vidět, o co jste obohatili poznání ve zkoumané oblasti, a to můžete vypíchnout jako přínos vaší práce.

Situace s primárními daty je také svým způsobem složitá. Zaprvé, existuje řada metod sběru dat, o kterých jsme už mluvili v 5. týdnu Letní výzvy – hlavní z nich jsou experiment, pozorování a měření. Naznačovali jsme, že každá metoda má své výhody a nevýhody, jako i svoji úroveň validity a reliability. Pozorně si nastudujte metodické postupy z odborné literatury, evidujte celý proces sběru dat a poctivě přistupujte k jejich vyhodnocení. Například pokud nemáte reprezentativní vzorek, nemůžete využít statistické indukce a zobecňovat výsledky. V žádném případě nefalšujte data ani výsledky, je to hrubým porušením akademické etiky, a často se na to přijde buď při obhajobě nebo u posudků. U primárních dat se ještě zamyslete, jaká data opravdu potřebujete pro zodpovězení vašich výzkumných otázek, testování hypotéz nebo řešení problému. Než začnete samotný sběr, naplánujte nejen co a od koho/čeho budete sbírat, ale i jak to později budete vyhodnocovat a k čemu se vám budou hodit tyto výsledky. Občas se třeba u dotazníků stává, že se studenti inspirují jinými dotazníkovými šetřeními (a ne vždy těmi nejlepšími), dávají všechny možné otázky bez ohledu na cíle šetření a vzorek a distribuují dotazník tak, aby dosáhli cílového počtu respondentů bez ohledu na reprezentativitu. Ve finále mají hodně dat, která však nemají praktickou hodnotu, jsou málo použitelná a práce nemá dobré výsledky. Takže naší radou pro vás je studium odborných zdrojů, konzultace s odborníky (vedoucí/m a dalšími odborníky) a pečlivá příprava plánu sběru a zpracování dat. Dobrým pomocníkem se může stát pilotní výzkum, kde na malém vzorku otestujete sběr dat a uvidíte, jestli vám hned vzniknou problémy například s pochopením otázek respondenty.

Dalším důležitým dělením je zpracování dat z kvantitativního a kvalitativního výzkumu. Většinou se tento materiál dotýká dat kvantitativní povahy, tzn. těch, které lze vyjádřit v číselném nebo pořadovém formátu. Mezi nejčastěji využívané metody pak můžete zařadit metody deskripce nebo explorace, metody statistické indukce, analýzy závislostí a metody vícerozměrné analýzy dat. U kvalitativního výzkumu pracujeme s velkým množstvím textu a statistiku v tom nejrozšířenějším pojetí moc nevyužijeme. Neznamená to však, že žádné metody zpracování nepoužíváme. Tam se může jednat o techniky transkripce, kódování, analýzu diskurzu apod. Navíc současný vývoj výpočetních možností nám umožňuje využívat například i metody Text Miningu pomocí statistického softwaru. Pokud byste se zajímali o konkrétní metody a způsoby sběru, vyhodnocení a prezentaci dat v kvalitativním výzkumu, doporučujeme alespoň tyto knihy:

  • HENDL, Jan, 2016. Kvalitativní výzkum: základní teorie, metody a aplikace. Čtvrté, přepracované a rozšířené vydání. Praha: Portál. ISBN 978-802-6209-829. – najdete je v různých knihovnách ČR.
  • CRESWELL, John W. Research design: qualitative, quantitative, and mixed methods approaches. 4th. Los Angeles: SAGE, 2014. ISBN 9781452226095;1452226091. – klasická monografie o kvantitativním, kvalitativním a smíšeném výzkumu. Je dostupné v NTK, náhled na Google Books.

Statistické zpracování dat

Kurz statistiky je nezbytná součást života každého studentu na PEF. Někdo to má rád, někdo moc ne, ale věřte, že statistika poskytuje skvělou a obrovskou sadu nástrojů k tomu, abyste mohli vaše data vhodným způsobem zpracovat a vyvodit závěry.

Abychom vám trochu připomněli základní statistické metody, které můžete využít v závěrečné práci, naše kolegyně Ing. Marie Šimpachová Pechrová, Ph.D. z Katedry informačních technologií pro vás udělala krátkou přednášku. Dozvíte se, jak se člení data, a jaké základní metody jsou vhodné pro jejich zpracování. Záznam přednášky najdete v kanálu MS Teams a prezentaci v souborech na odkazu. Pokud byste měli další dotazy k prezentaci nebo statistickým metodám, můžete se obrátit na kolegyni, jejíž kontakty najdete na konci prezentace.

Na co bychom vás ještě chtěli upozornit u statistických metod, je vhodnost uplatnění té či oné metody. Vždy se zamyslete nad tím, co řešíte, a najděte nástroj, který vám pomůže odpovědět na otázku. Třeba jestli zkoumáte, jak určitý činitel ovlivňuje objekt vašeho výzkumu, je dobré provést testování závislosti a určit jeho sílu.

Další důležitý bod – dodržujte zadání. Pokud ve svém zadání máte „využití matematicko-statistických metod“ nebo „modelování časové řady“, tak to musíte splnit a pravděpodobně nebude stačit jednoduchá deskripce. Mějte na paměti i limity statistických metod a pravděpodobnostní charakter stochastických jevů.

Chyby v závěrečných pracích

Bohužel je těžké udělat kompletní výčet všeho, co se může stát v závěrečné práci, ale spíše se zaměříme na nejčastější chyby, kterých se můžete vyvarovat, a na důležité věci, na které byste si měli při psaní dát pozor. Jsou to chyby jak u zpracování dat, tak i velmi banální chyby při tvorbě grafů či tabulek.

  • Sběr dat, která pak nejsou analyzována; nejsou testovány hypotézy, které byly stanoveny na začátku, a to už z hlediska absence dat nebo z zanedbanosti.
  • U dotazníků použití nevhodných nebo nerovnoměrných intervalů (např. u otázky na věk respondenta); nekonzistentnost škál v dotazníku (současné využití pěti- a sedmistupňové škály bez řádného důvodu); stanovení nevhodných škál pro určité proměnné (např. vzdělání je většinou škálou ordinální, i když možnosti jsou vyjádřeny slovně); využití uzavřeného typu otázky bez kompletního výčtu možností.
  • Buďte si vědomi toho, že pokud sbíráte data o lidech, narazíte na problematiku GDPR. Jestli se ptáte starosty určité obce, je to přesně identifikovaná osoba i bez toho, abyste uváděli v práci jeho jméno a příjmení. V tomto případě je dobré si zajistit souhlas od dotyčné osoby. Ve složitějších případech lze hledat pomoc odborníků, např. na ÚOOÚ.
  • U kvalitativního výzkumu se často uvádějí jako chyby: neznalost analytických technik a postupů; snaha zobecňovat výsledky; chybná transkripce; kvantifikace dat („33,3 % z deseti respondentů uvedlo…“); příliš rozsáhlé části přepisu rozhovorů v těle práce (větší celky lze dát do příloh); nedostatečná analýza, syntéza a vyhodnocení; použití jenom deskriptivního jazyka; příliš subjektivní hodnocení ze strany výzkumníka.
  • Absence ucelené interpretace dat a její nahrazení jednoduchou deskripcí. Zamyslete se nad tím, jak vaše výsledky korespondují s teorií, s jinými výsledky, jaké nové závěry z toho můžete udělat.
  • Rozlišujte prezentaci a interpretaci dat. Prezentace je o numerickém popisu, o třídění získaných dat, o dílčích analýzách a vytvoření stručného popisu. Interpretace se zaměřuje na výklad dat a souvislostí, vytvoření názorové konfrontace nebo shody, hodnocení dat, využití kritického myšlení a vytvoření uceleného závěru. Pro závěrečnou práci je dobrá interpretace klíčová.
  • Nedodržení všech náležitostí u grafů, tabulek, vzorců, obrázků – přesné návody, jak tyto části textu mají být formátovány, najdete v pokynech fakulty. Zkontrolujte, že je máte konzistentní napříč celému textu – označení, zdroj apod. Nezapomeňte, že se každý typ tohoto vizuálního obsahu čísluje zvlášť.
  • Každý vizuální obsah má být opodstatněný. Není potřeba prezentovat stejnou informaci v tabulce a v grafu najednou. Stejně jako není potřeba tvořit grafy pro všechna data za každou cenu. Zamyslete se nad tím, jestli má graf přidanou hodnotu oproti slovnímu popisu nebo tabulce. Například typicky využívaný výsečový graf s rozdělením respondentů dle pohlaví se dá snadno změnit na jednu jednoduchou větu.
  • U grafických elementů si zvolte odpovídající velikost, není vhodný graf, který navíc nenese hodně užitečných informací a zabírá téměř celou stránku. Působí to spíše tak, že se student snaží zvýšit počet stránek v práci. Pokud některé tabulky nejsou podstatné pro pochopení výkladu, mají jenom podpůrnou funkci či jsou až moc velké, dejte je do příloh a řádně na ně odkažte v textu.
  • Dodržujte citační etiku a poctivě citujte zdroj obrázku pomocí odpovídající metody a stylu. Pokud jste obrázek nebo graf mírně upravili nebo přeložili popisky z angličtiny do češtiny, uveďte to jako např. „Zdroj: upraveno dle Novák, 2020, str. 215“ nebo „Zdroj: upraveno dle Smith, 2010. Překlad autora”.
  • Při převzetí obrázku, schéma nebo dalších grafických elementů si dejte pozor na autorská práva. Existují totiž výjimky, které dovolují využívat takové informace v závěrečných pracích, nicméně byste měli být seznámeni s různými typy licencí a vybírat to, na co máte právo. Pokud si nejste jisti, jestli to děláte správně, dobře zpracovaný průvodce legálním užíváním obrazových a jiných netextových zdrojů najdete na odkazu.
  • Pokud je to možné, při přebírání grafů nebo obrázků přeložte názvy a nadpisy do jazyka, ve kterém je práce psána.
  • Na každý graf, tabulku, obrázek či vzorec má existovat odkaz v textu, který podkládá opodstatněnost jeho použití. Odkaz má být na patřičném místě a co nejblíže k odpovídajícímu grafickému prvku.
  • Je zbytečné a občas i neestetické duplikovat název grafu v oblastí textu a v oblasti grafu (což se často stává při tvorbě grafů v Excelu). Název grafu má být vystihující a srozumitelný. Samotný graf má být pochopitelný i bez slovního komentáře.
  • Je potřeba zvolit typ grafu, který znázorňuje data nejvhodnějším způsobem (viz materiály pro samostudium).
  • U grafu dejte pozor na popisky os, jednotky, legendu. Všechny nadpisy mají být čitelné a srozumitelné. Stejně tak při výběru barev se zamyslete, jak tyto barvy mohou být vnímány, a jak budou vypadat v tištěné verzi závěrečné práce.

Materiály pro samostudium

Jako vždy jsme si pro vás připravili materiály, které vám pomohou se zpracováním a prezentací dat.

Pro dnešek je to všechno. Máte od nás ještě zadání, které vám toto téma pomůže procvičit. Příští týden vás naučíme správně citovat a využívat citační manažery. Čeká vás i webinář s Mgr. Terezou Garamszegi, který se uskuteční ve středu 07.09. od 15:00 v MS Teams.
Těšíme se na vás a uvidíme se příští týden!

Zadání

  1. Jestli využíváte jako metodu sběru primárních dat dotazník, vytvořte výzkumný plán, plán výběru respondentů, jaká data potřebujete pro testování hypotéz a pro zodpovězení výzkumných otázek. Napište první draft dotazníku a dejte ho kamarádům nebo příbuzným. Poznamenejte si všechno, co způsobuje komplikace u pilotních respondentů. Zamyslete se, jak můžete s těmito novými informacemi dotazník vylepšit.
  2. Zpracování dat většinou probíhá za pomocí softwarů. Podívejte se, jakou povahu mají data, která sbíráte. Jaké softwary jsou vhodné pro zpracování takových dat? Vystačíte si s Excelem, nebo potřebuje statistické nástroje typu SPSS či Statistika? Zjistěte, jestli tento software máte k dispozici. Zamyslete se nad tím, kam data budete ukládat (cloud, počítač, repositář).

Seznam zdrojů

CRESWELL, John W. Research design: qualitative, quantitative, and mixed methods approaches. 4th. Los Angeles: SAGE, 2014. ISBN 9781452226095;1452226091.

DIBUSZOVÁ, Eva et al., 2021. Průvodce legálním užíváním obrazových a jiných netextových zdrojů: jak to dělat správně. Praha: Vysoká škola chemicko-technologická v Praze [online]. ISBN 978-80-7592-115-4. Dostupné z: https://vydavatelstvi.vscht.cz/katalog/publikace?uid=uid_isbn-978-80-7592-115-4

ENGEL, Uwe, Anabel QUAN-HAASE, Sunny Xun LIU a Lars LYBERG, ed., 2022. Handbook of computational social science: data science, statistical modelling, and machine learning methods. Abingdon, Oxon: Routledge. European association of methodology. ISBN 978-1-032-07770-3.

FIRSOVA, Nadezda, 2020. Napíšu diplomku – Lekce č. 6 Metody získávání dat a dotazníková šetření. In: YouTube [online]. 10.11.2020 [cit. 2022-08-15]. Dostupné z: https://www.youtube.com/watch?v=H06exta2vpE. Kanál uživatele Moravskoslezská vědecká knihovna.

HENDL, Jan, 2017. Přehled statistických metod: analýza a metaanalýza dat. Páté, rozšířené vydání. Praha: Portál. ISBN 9788026209812;8026209818;.

HENDL, Jan, 2016. Kvalitativní výzkum: základní teorie, metody a aplikace. Čtvrté, přepracované a rozšířené vydání. Praha: Portál. ISBN 978-802-6209-829.

HENDL, Jan a kol. 2014. Statistika v aplikacích. Praha: Portál. ISBN 978-80-262-0700-9.

IVANOVÁ, Kateřina, 2020. Dotazník | EDULAM. In: YouTube [online]. 21.04.2020 [cit. 2022-08-15]. Dostupné z: https://www.youtube.com/watch?v=k4ewG_ELLyo&list=PLdL0lwY-e2BQpdOcA51R5JBb0wqf1BT6r&index=25. Kanál uživatele Moravská vysoká škola Olomouc.

KIT PEF ČZU V PRAZE, 2022. Pokyny pro zpracovávání závěrečných prací na katedře informačních technologií. Katedra informačních technologií PEF ČZU v Praze [online]. Praha: KIT PEF ČZU, Březen 2022 [cit. 2022-07-10]. Dostupné z: https://kit.pef.czu.cz/zaverecne-prace

KOŠŤÁKOVÁ, Tereza, 2019. O složitém jednoduše, aneb, Nebojte se statistiky, nekouše. Praha: Český statistický úřad [online]. ISBN 978-80-250-2908-4. Dostupné z: https://www.czso.cz/documents/10180/111112819/99020519.pdf

KRÁSNIČAN, Veronika, 2021. Workshop: Dotazníkové šetření a jeho specifika. In: YouTube [online]. 15.11.2021 [cit. 2022-07-15]. Dostupné z: https://www.youtube.com/watch?v=rB_tkw057f0. Kanál uživatele Akademická Etika.

KRUEGER, Stephanie, ed., 2021. STEMskiller: Reading and interpreting graphs, plots, & statistical data. NTK [online]. Praha: NTK [cit. 2022-09-02]. Dostupné z: https://www.techlib.cz/en/84167-reading-and-interpreting-graphs-plots-amp-statistical-data

MIŠOVIČ, Ján, 2019. Kvalitativní výzkum se zaměřením na polostrukturovaný rozhovor. Praha: Slon. Studijní texty (Sociologické nakladatelství). ISBN 978-80-7419-285-2.

MIŠOVIČ, Ján, 2001. V hlavní roli otázka: (průvodce přípravou otázek v sociologických a marketingových výzkumech). Praha: [s.n.]. ISBN 80-238-6500-5.

PEF ČZU V PRAZE, 2018. Závěrečné práce. Provozně ekonomická fakulta ČZU v Praze [online]. Praha: PEF ČZU, 2021 [cit. 2022-07-10]. Dostupné z: https://www.pef.czu.cz/cs/r-7008-studium/r-7026-informace-pro-studenty/r-12261-zaverecne-prace

RABUŠIC, Ladislav, Petr SOUKUP a Petr MAREŠ, 2019. Statistická analýza sociálněvědních dat (prostřednictvím SPSS). 2., přepracované vydání. Brno: Masarykova univerzita. ISBN 978-80-210-9248-8.

ŘEZANKOVÁ, Hana, 2017. Analýza dat z dotazníkových šetření. (Čtvrté přepracované vydání). [Praha]: Professional Publishing. ISBN 978-80-906594-8-3.