Подготовка эмпирических данных к обработке и анализу


Читайте также:
  1. A) По типу данных
  2. A) приемы создания и хранения данных, обработки и передачи данных, принципы управления и функционирования ВТ
  3. A) прикладная программа, предназначенная для обработки структурированных в виде таблицы данных
  4. A) Результат вычисления формулы на основе имеющихся данных
  5. A) Схема данных
  6. A) Тип диаграммы, Диапазон данных, Параметры диаграммы, Размещение диаграммы
  7. ArcSDE базы геоданных
  8. Exel. Сохранение документа, подготовка к печати. Использование колонтитулов.
  9. III. ПОДГОТОВКА МАТЕРИАЛОВ К ДИПЛОМНОМУ ПРОЕКТУ
  10. IV. НАУЧНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ И ПОДГОТОВКА КАДРОВ
  11. IV. Подготовка к программе «Полная очистка организма»
  12. RAID 3. Отказоустойчивый массив с параллельной передачей данных и четностью (Parallel Transfer Disks with Parity)

Роль эмпирических данных в изучении социальных явлений огромна. Достаточно глубокое изучение интересующих социолога закономерностей невозможно без опоры на анализ конкретных фактов, в которых эти закономерности, собственно говоря, и проявляются. Именно реальные эмпирические факты, как правило, служат средством проверки теорий, наводят на мысль о необходимости их корректировки, служат почвой для формирования новых теоретических гипотез.

Эмпирические данные могут представать перед исследователем в виде:

  • совокупности чисел, характеризующих те или иные объекты (в качестве таких совокупностей могут выступать, например, производственные характеристики предприятий, возраст респондентов, оценки выпускниками школ, престижности некоторых профессий и т.д.);
  • множества индикаторов определенных отношений между рассматриваемыми объектами (к примеру, при изучении производственных бригад такими индикаторами могут служить указания каждого члена бригады на то, нравится ли ему работать вместе с любым другим членом той же бригады, такие данные часто используются при изучении малых групп;
  • результатов попарных сравнений респондентами каких-либо объектов (такие данные используются в методе парных сравнений — способе построения шкал, отражающих усредненное отношение изучаемой совокупности респондентов к каким-либо объектам).
  • совокупности определенных высказываний (например, ответов респондентов на вопрос об их профессии, о том, что им нравится в политике правительства; письма читателей газеты в редакцию; фрагменты из журнальных статей и т.д.),
  • текстов документов;
  • так или иначе зафиксированных результатов наблюдения за невербальным поведением каких-либо людей и т.п.

Наиболее часто в социологических исследованиях данные представляют собой совокупность значений каких-либо признаков (характеристик, переменных, величин), измеренных для каждого из изучаемых объектов.

Признак — это некоторое общее для всех объектов качество, конкретные проявления которого могут меняться от объекта к объекту. Примеры признаков — пол, возраст респондентов, их удовлетворенность своим трудом и т.д. В качестве значений признака "возраст" могут выступать 25 лет, 48 лет, 21 год.

Сами эмпирические данные социологического исследования еще не позволяют сделать верные выводы, обнаружить тенденции, проверить выдвинутые в программе исследования гипотезы.

Полученную первичную социологическую информацию следует обобщить, проанализировать и научно интерпретировать. Для этого все собранные анкеты или бланки интервью необходимо проверить, закодировать, ввести в компьютер, сгруппировать полученные данные, составить таблицы, графики, диаграммы и т.д.

На первом этапе производится контроль за качеством заполненных документов, исправление ошибок и отбраковка (выбраковка) некачественно заполненных анкет, бланков, карточек и т.п. Вначале выявляется правильность ответа на каждый вопрос и при необходимости ответ исправляется. Из всех имеющихся анкет исключаются следующие:

  • заполненные менее чем на 2/3;
  • заполненные неразборчиво;
  • не прошедшие тест по совокупности контрольных вопросов;
  • с незаполненным социально-демографическим блоком (пол, возраст, образование и т.д.).

Далее все допущенные к обработке на ЭВМ документы нумеруются, начиная с №1, для контроля за их прохождением. Полученный массив документов передается кодировщикам. Обычно, при внесении в компьютер информации для статистической обработки, ответы на вопросы анкеты кодируются числами. Строчные переменные используются достаточно редко, например, для введения ответов на открытые вопросы или фамилий респондентов, если имеется такая возможность и в них есть необходимость, например переменная dj56. Кодирование (перевод информации на формализованный язык обработки данных) — связующее звено между качественной и количественной информацией. На данной основе осуществляются числовые операции с информацией, введенной в память ЭВМ. Если во время кодирования произойдет сбой, замена или потеря кода, то информация окажется неправильной.

На следующем этапе производится обработка первичной информации для ее обобщения. Результатом обобщения является социологическая информация. Измерительной частью инструмента для оценки социальной информации, собираемой в процессе конкретного социологического исследования (опрос, наблюдение, анализ документов, эксперимент) являются шкалы. Обычно в литературе указывается 4 типа шкал: номинальная (наименование), порядковая (ранговая), интервальная и шкала отношений.

Номинальная шкала отражает дихотомичный ответ («да» или «нет») или устанавливает отношения равенства между объектами, которые объединяются в одну категорию. Например, вопрос анкеты: «Ваша профессия» — может включать варианты ответов: 1-слесарь; 2-токарь;3-плотник;4-столяр и т.п. При этом, если столяру соответствует числовое обозначение 4, это не значит, что он находится на четвертом месте после слесаря по уровню своей квалификации.

Шкала порядка имеет свойства номинальной шкалы в сочетании с отношением порядка. Она позволяет ранжировать свойства социальных явлений. Например, студенты первого, второго, третьего и т.д. курса. Здесь имеется в виду, что студент второго курса обладает большими знаниями, чем студент первого курса.

Интервальная шкала более детальна. Она допускает обстоятельную математическую обработку. В социологическом исследовании с ее помощью измеряются те характеристики, которые можно выразить числами (возраст, образование, стаж работы и др.).

К шкалам отношений в социологии относится, например, заработная плата, измеряемая в рублях.

От типа шкалы зависят возможности применения математических методов обработки и анализа первичной социологической информации. Когда используются номинальные шкалы, возможно нахождение частот распределения, средней тенденции по модальной частоте, вычисление коэффициентов связи, применение непараметрических критериев проверки гипотез. Из статистических показателей на порядковом уровне использую показатели центральной тенденции – медианы, квартили и т.д. Для выявления взаимозависимости признаков используют коэффициенты ранговой корреляции Спирмена и Кендалла. Интервальные шкалы допускают все статистические операции, присущие порядковому уровню; возможны также вычисления средней арифметической, дисперсии и др. Вместо ранговых коэффициентов корреляции вычисляется коэффициент парной корреляции Пирсона. Шкалы отношений позволяют применять наряду с этими методами полный арсенал математических методов. Поэтому они предпочтительнее других шкал.

Далее производится обобщение первичной социологической информации, простейшей формой которого является группировка. Затем информация анализируется. На заключительном этапе составляется отчет.