Замечательная иллюстрация (отсюда) к одной моей старой записи ("О птичках"), доля женщин среди получателей дипломов бакалавра в Америке. Удивительно - ещё недавно доля биологичек была меньше, чем математичек, а психологичек меньше, чем психологов.
Просто каждое объяснение должно быть универсальным - в смысле, работать во всей области своего разумного применения. Например, Вы предлагаете объяснение "женщины с Венеры", но, понимая, что оно может только очень грубо объяснить разный уровень кривых, предлагаете к нему более тонкую поправку с "экономикой труда". Два параметра для одной переменной - не крамола. Они облегчат Вам задачу объяснить уровень каждой из кривых, а не только некоторых. То есть, Ваше объяснение вполне способно быть "универсальным". Но так как комбинация двух параметров позволяет гораздо лучше приблизить данные, чем использование только одного параметра, тут есть другая опасность - того, что мы примем случайное совпадение за объяснение. Проверкой было бы предсказать долю женщин для профессии, которой нет на графике, а потом проверить. Часто бывает, когда есть два параметра - грубый и тонкий, что точность предсказания оказывается гораздо хуже, чем всё влияние тонкого параметра. А значит, можно было его и выкинуть с самого начала, облегчив себе жизнь.
no subject
http://i-eron.livejournal.com/120626.html?thread=1746994#t1746994
Просто каждое объяснение должно быть универсальным - в смысле, работать во всей области своего разумного применения. Например, Вы предлагаете объяснение "женщины с Венеры", но, понимая, что оно может только очень грубо объяснить разный уровень кривых, предлагаете к нему более тонкую поправку с "экономикой труда". Два параметра для одной переменной - не крамола. Они облегчат Вам задачу объяснить уровень каждой из кривых, а не только некоторых. То есть, Ваше объяснение вполне способно быть "универсальным". Но так как комбинация двух параметров позволяет гораздо лучше приблизить данные, чем использование только одного параметра, тут есть другая опасность - того, что мы примем случайное совпадение за объяснение. Проверкой было бы предсказать долю женщин для профессии, которой нет на графике, а потом проверить. Часто бывает, когда есть два параметра - грубый и тонкий, что точность предсказания оказывается гораздо хуже, чем всё влияние тонкого параметра. А значит, можно было его и выкинуть с самого начала, облегчив себе жизнь.