Состояние проекта “Биография области”

Цели и задачи заказчика

Цель - понять, как происходило заселение современной Псковской области.

Задачи

Задачи обработки данных

Специфика заключается в том, что элементами выборки являются не респонденты, а кусочки их генеалогических деревьев (от респондента до его бабушек/дедушек и/или до родителей его жены). Главный интерес - это момент въезда в Псковскую область. Поскольку анкетные данные содержат информацию только о месте выезда каждого родственника (откуда он приехал), но не место приезда, то остаётся возможность только с погрешностью определять въезд предка по месту опроса респондента и его месту выезда, если оно было. Т.е. если мать приехала из Башкирии, а респондент, опрошенный в Бежаницах, ниоткуда не приезжал, можно предположить, что мать приехала в Бежаницы, а респондент жил с ней одном и том же наспункте. Если же у респондента указано, что он приехал из Гдова, можно предположить, что мать из Башкирии приехала в Гдов. Хотя на самом деле она могла из Башкирии приехать в Струги, потом переехать в Гдов.

Миграция происходит снаружи в Псковскую область, и внутри области. Нам нужно фиксировать любые передвижения. Если не пытаться выделять типичные схемы движения семей (“Деды обычно приезали из Башкирии в Бежаницы, а их внуки переезжали в Гдов, а у дедов, приехавших из Мурманска в Плюссу, дети переезжали в Опочку”), то можно любое перемещение переводить в единицу выборки. Например, если дед приехал из А в Б в Х-году, мы это добавляем отдельным наблюдением, а его внук переехал из Б в В в Х2-году, то внука добавляем отдельным наблюдением, несвязанным с дедом. Отдельный случай, когда никто в семье респондента не переезжал - коренной респондент. Каждая семья в этом случае даст от одного до десяти наблюдений.
Или фиксировать и не перемещения тоже?

Откуда приехали жители

Отчёт позволяет понять, какие районы страны (мира) стали основными для заселения Псковской области. Более подробные детали позволют увидеть, как менялись районы выезда будущих жителей Псковской области с течением времени.

Следует предусмотреть возможность получения отчёта по отдельно взятому району Псковской области. Соответственно, инструментом для генерации таких отчётов должна стать функция, применяемая к массиву наблюдений.

Возникает вопрос, где мы производим разбиение дерева респондента на отдельные случаи - до применения функции или после. Чтобы на него ответить, нам нужно более чётко понимать, что мы хотим получить на выходе.

Мы должны уметь получать количество людей, приехавших из определённой территории за определённый промежуток времени.

Также должа быть возможность определение места выезда в разных масштабах: город, область, страна. Т.е. сначала унифицируем данные о всех местах, переведя их в координаты, затем из координат получаем все возможные масштабы.

Будет ли достаточно массива, где по каждому въезду указано место отправления, предполагаемое место прибытия и год? Например, мы хотим получить структуру приезжих в Бежаницкий район в 60-х годах. Отбираем все данные по району за указанное время и смотрим распределение приездов.

А долю коренного населения по сравнению с приезжим? Тогда надо знать, сколько коренных до этого момента было. Здесь ошибка, если живущие тогда не оставили потомков, которых сейчас мы могли бы опросить и узнать у них про предков. Хотя она может быть равной среди приезжих и коренных. Пока не будем ориентироваться на эту задачу.

Текущее состояние

Структура прототипа семьи

Позволяет хранить в одном объекте информацию о всей семье респондента, определять поколение.