ny_quant: (Default)
[personal profile] ny_quant
Недавно [livejournal.com profile] mratner поделился со мной ссылкой на базу данных, созданную Charles Murray для иллюстрации своей новой книги "Coming Apart", недавно обсуждавшейся. (Книгу пока не читал, но собираюсь.) Я решил немного посмотреть и вот что сразу бросилось в глаза.

Как и следовало ожидать, в общем более образованные люди зарабатывают больше денег.



А теперь посмотрим на верхний слой нашего общества, который Murray объединяет в супер-зипкоды.



Оказывается не всё так просто. Для этой группы никакой корреляции между образованием и доходами не видно. А для какого-то (как его опознать? надо бы порыться но некогда) подмножества явно имеет место обратный эффект. Странно, правда?

Date: 2012-03-24 07:46 pm (UTC)
From: [identity profile] murfury.livejournal.com
Обычный self-selection/endogeneity.

Например, удачливые drop-out типа Стива Джопса мигрируют в "супер-районы".
Кроме того, сравнение двух диаграмм наводит на мысль о том, что "супер-районы" выбирались на основе дохода и образования - тех самых переменных, по которым считается корреляция )

Если бы все было так просто, то не было бы сотен статей по labour economics


Date: 2012-03-24 08:49 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Да, они именно так и выбирались. Всё же странно, что на втором графике корреляция пропала.

Date: 2012-03-24 10:35 pm (UTC)
From: [identity profile] yucca.livejournal.com
Кинозвезды, рок-звезды, футболисты?

Date: 2012-03-24 11:22 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Не, ну там же целые зипкоды, почти тысяча. Футболистов и рокзвезд столько не наберешь.

Date: 2012-03-25 02:08 am (UTC)
From: [identity profile] insead-hec.livejournal.com
Но тренд все равно идет вверх, я проверил по 795 зипкодам с населением больше 500 взрослых. регрессия тоже дает положительный коеффициент.

другой вопрос, что первично, а что вторично.
.
P.S. А за ссылку спасибо. Теперь когда студенты будут уверять меня, что мы находимся во втором по богатству зипкоде страны, я смогу со знанием дела поправить их, что по доходам мы всего лишь десятые.
Edited Date: 2012-03-25 02:24 am (UTC)

Date: 2012-03-25 04:03 am (UTC)
From: [identity profile] ny-quant.livejournal.com
Мой график построен именно для зипкодов с населением больше 500 взрослых. Тот "факт", что регрессия тоже дает положительный коеффициент мне представляется несущественным. Важен не только знак, но и величина. Всё, что меньше 25% можно смело считать нулём. Да и от 25 до 50%, в обшем, тоже. Иногда гораздо полезнее просто посмотреть на облако точек, и ничего считать не надо.

Date: 2012-03-24 11:54 pm (UTC)
From: [identity profile] c0nfigure.livejournal.com
Корреляция со вторым моментом дохода.

Date: 2012-03-25 06:09 pm (UTC)
From: [identity profile] nedosionist.livejournal.com
Нет, не странно, этот "обратный эффект" возникает в силу построения. Заметьте, что аналогичная линия получится и при отсечении 2%, и 10% итд. (у Мюррея - 5%).

Date: 2012-03-25 06:57 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Не понял, что значит "в силу построения"?

Date: 2012-03-25 07:48 pm (UTC)
From: [identity profile] nedosionist.livejournal.com
Мюррей строит свой индекс (в колонке сентиль) как линейную комбинацию образования и дохода. Т.о. для фиксированного значения индекса, образование и доход обратно связаны. В координатах образование - доход, как у Вас, изо-сентили - это линии с отрицательным наклоном.

Date: 2012-03-25 08:29 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Да, ларчик просто открывался!

Profile

ny_quant: (Default)
ny_quant

August 2022

S M T W T F S
 1234 56
78910111213
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 13th, 2025 01:41 pm
Powered by Dreamwidth Studios