polenadisto: (hairs)
Прислали мне тут вчера из сообщества "Углубленный биолог" вконтаче картиночку:


Ну, лучший коммент под нею в сообществе был, на мой взгляд, следующий (и не зря набрал самым залайканным оказался):
"никто не заставит применять статистику, если вообще не делать рисеч"

А я что? А я ничё: не применять статистику там, где надо - такая же ошибка, как применять ее неправильно, или применять там, где не надо. Последнее осознается гораздо реже, но от того проблемой быть не перестает.
А вообще, статья эволюциониста (антидарвиниста при том), энтомолога и статистика А.А. Любищева "Об ошибках в применении математики в биологии", опубликованная аж в 1969 г. в ЖОБе, не зря состоит из двух частей: "Ошибки от недостатка осведомленности" и "Ошибки, связанные с избытком энтузиазма" (и спасибо выложившим ее томским биостатистикам!). Там далеко не только про статистику, что-то сейчас устарело, где-то можно с автором поспорить - но статьи, безусловно, душеполезны.
polenadisto: (bat)
Я уже как-то писал о том, что использование дисперсии в качестве основного показателя разброса, несмотря на ее несоизмеримость с описываемой величиной, основывается на том, что ее можно раскладывать на независимые компоненты. Так в дисперсионном анализе и факторном анализе вычленяют вклад отдельных факторов, в количественной генетике фенотипическую дисперсию разлагают на генетическую (а ту - на аддитивную, доминантную, эпистатическую...) и фенотипическую (ну еще и на взаимодействие генотип-среда, да).

Школьникам-"биологам" нелегко бывает понять, "зачем так". В итоге придумал им такую задачу, модифицировав известный им тип (услышав зачин, многие начинают выть):
К бассейну подсоединены две трубы: по одной вода втекает, по другой - вытекает. При этом пропускная способность труб переменна во времени: у вносящей трубы средняя составляет 4,5 л/мин, у выносящей - 4 л/мин, а дисперсии соответсвенно равны 1 л2/мин2 и 0,5 л2/мин2. Чему равна средняя скорость наполнения бассейна и ее дисперсия, если пропускные способности выносящей и вносящей труб меняются независимо?

Тут еще, исходя из свойств дисперсии, предполагается догадаться, что дисперсия разности независимых случайных величин равна сумме их дисперсий.
polenadisto: (hairs)
Студенты, обучаемые биоматематике, прониклись тем, что в теории графов термины звучат как бытовые слова.
Изучали с ними деревья (которые связные графы без циклов) и упомянул в качестве хохмы, что граф, состоящий из нескольких деревьев, называется лесом (не много литературы читал, но кроме цитированного уже по этому поводу учебника Оре, нигде его не встречал). Рассказал и про то, что если выделить в дереве отдельную вершину, называемую корнем, то дерево станет укорененным (это-то термин биологам знаком, он в филогенетике применяется). И что висячие вершины в дереве называются листьями.
Ну и студенты, оказывается, додумалась, что подграф, полученный из дерева путем удаления вершины-корня, можно называть дровами. Что интересно, в этом случае дрова являются частным случаем леса.
polenadisto: (bat)
Рассказывал на прошлой неделе юным эволюционерам про цикломатику графов - а один в это время старательно изображал графа Дракулу в виде эйлерова графа (вроде бы получилось, если ни он, ни я не ошиблись в подсчете степеней вершин).

polenadisto: (hairs)
В догонку к прошлому посту про леса как совокупность деревьев с точки зрения теории графов.

Как-то был на заседании кафедры энтомологии - кажется, один коллега предзащищался. Работа была по филогении, так что там наличествовало много соответствующих деревьев, которые предзащищант так и называл.
Потом, на обсуждении, один из профессоров (кто именно - я помню смутно, да и не важно это) спросил: "А вот вы постоянно говорите "деревья". Но разве это не жаргон?"

Ну тут я не выдержал и с задней парты сообщил: "Нет! Это математический термин! Дерево - это связный граф без циклов!"
Не очевидно, что все поняли смысл определения, но главное было уловлено - слово "дерево" в этом контексте можно употреблять.
polenadisto: (hairs)

Вбатываюсь в теорию графов ради улучшения своего биоматематического спецкурса.

Нашел прекрасное, геоботаникам на заметку:

"Связный граф, в котором отсутствуют циклы, называется деревом. Граф, в котором отсутствуют циклы, называется лесом. Поскольку каждая компонента леса - связный граф, то лес является объединением деревьев" (О.И. Мельников, 2016. Теория графов в занимательных задачах. М.: URSS).

UPD. А коллеги-геоботаники сказали на это, что как раз учат детей, что лес - это не просто совокупность деревьев!

polenadisto: (bat)
Решил в этом году существенно переработать свой биоматематический спецкурс на кафедре (а то уже четырем курсам прочитал - и в своем нынешнем виде он себя явно изжил).
И что же выяснилось? Что занимающий важное место в моем же спецкурсе "Коэволюционной биологии" Роберт Мэй,пионер эволюционной эпидемиологии, оказывается, своими работами повлиял и на Митчелла Фейгенбаума, приблизив его к открытию константы имени себя. И вообще Мэй был важным пропагандистом идеи динамического хаоса среди биологов.
Нашел это в статье с мерзотненьким* названием, но небезынтересным содержанием "хаос и порядок: фрактальный мир", опубликованной в нашей "Природе" в 2015.
Вот так и думаешь, что это - разные, непересекающиеся области твоих интересов. Ан нет.

_______________________________
*Мне в подобном титуловании видится слишком много ванили и понтов.
polenadisto: (bat)
Простые числа!..
Несчастный случай

Вечер 2го января, торговый центр В Туле. Стою, жду подругу. Глаз падает на Yot'овскую рекламу "Пора обновиться до 2017" - и в голове вспыхивает задачка по теории чисел(?): Как часто простые числа заканчиваются на ту или иную "нечетную" цифру (в десятичной записи)?

Ну, то есть понятно, что на пятерку - никогда. Остается 1,3,7,9.
Даже захотелось исследовать проблему. Естественно, по-своему, экспериментами и наблюдением, а не дедуктивно. Благо, насколько я знаю, сейчас с задачами из теории чисел так частенько и поступают - тупо смотрят, что там, с этими простыми числами, на первых сотнях, тысячах, миллионах...
Правда, еще подумал, что можно пристреляться, посмотрев, как часто вышеозначенные цифры возникают в результату умножения однозначных чисел. Из таблицы Пифагора вышло, что примерно одинаково (единица и девятка - три раза, тройка и семерка - по два раза; перестановки множителей не учитывались, т.е. 3х7=7х3=21 считались за одно*).
Коллеги, математики и биологи, принесли ссылки на Хабрахабр и ScienceNews о статье в арХиве, где показано (опять же путем прямых наблюдений), что последние цифры последовательных чисел распределены неравномерно. Но там же сказано, что само по себе распределение последних цифр в простых числах вполне равномерно... Вот так-то.
__________________
*Хотя, может, это и неправильно? Всё равно, принципиально результат вроде бы не меняется).
polenadisto: (bat)
Одна из основных прелестей математики - в том, что одни и те же математические конструкты могут быть проинтерпретированы по-разному и, соответственно, применены. И, бывает, что это применение находится сильно позже, а совершенно разные части реальности ВНЕЗАПНО оказываются описываемы одним математическим конструктом.

Еще забавнее, что иногда математики сами считают какие-то свои приблуды не имеющими какого-то разумного смысла. Другие-то - ладно (помню, как одна кафедральная сотрудница, уже давно не студентка, с удивлением узнала от меня, что комплексные числа много где применяются - с первого курса пребывала в святой уверенности, что это исключительно ради издевательств над бедными студентами).
Интересно тут с многомерными пространствами. Когда-то математики и степеням выше куба не очень-то доверяли. Джероламо Кардано, вон, в своем "Ars magna" писал, говорят, что до первая степень - это линия, вторая - поверхность, третья - объем, а четвертая (речь шла о решении уравнений) природой не позволяется, посему там можно только в общих чертах (вот они, игры ума!). Да и формула Герона строгих древнегреческих формалистов, говорят, могла бы смутить, так как там приходится одновременно перемножать четыре числа.
Но сейчас-то, думаю, никого никакими степенями не напугаешь. Хоть даже дробными.

А вот многомерные пространства - это да, это вольный полёт математической фантазии! Иногда соприкасающийся не то с мистиками, не то с фантастами. Ну да, сейчас еще, конечно, с физикой и космологией. Но вот попроще, "для биологов"?
Да самое непосредственное соприкосновение! Ведь многомерные пространства оказываются очень удобным методом оценки общего сходства объектов, описываемых большим числом признаков. Что может быть логичнее (через века после Декарта), чем изображать графики рассеяния двух переменных в виде точек на плоскости, а для трех - в пространстве? А дальше - ступор. Или нет? Тут-то и пригождаются нам многомерные пространства (которые в свое время и математиками воспринимались как нечто оторванное от реальности). Чего уж проще, чем график рассеяния для n переменных изображать в виде облака точек в n-мерном пространстве? То есть, изображать-то неудобно, да - но вот работать с этими многомерными облаками можно. И близость объектов тоже прямо-таки напрашивается измерять как расстояние - хоть привычное евклидово, хоть еще какое, что ближе к задачам. Мне с ходу вспоминается "семинарская" (в смысле, что я ее на семинарах по теории эволюции использовал) статья в PNAS'e о неофункционализации новых копий старых генов, где так смотрели различия в профилях экспрессии генов по тканям (вот ее пересказ мой, если кому надо).
Мне в свое время многомерные пространства тоже мозг ломали, но после какой-то мелкой советской школьной брошюрки "Метод координат" у меня все сложилось - и я их в каком-то смысле "представляю". В смысле, что мне становятся понятны геометрические интерпретации, например, соответствующих методов статистики вроде кластерного или факторного анализа. Школьники, правда, обычно испытывают шок, когда мы разбираем двух- и трехмерные примеры, а потом выясняется, что у нас теперь облако точек многомерно. Но в итоге шаблоны собираются обратно и некоторые даже могут простенькие качественные задачки решать, используя геометрическую интерпретацию.

Ну а у нас же объекты часто имеют больше трех существенных признаков. Так что многомерные пространства всегда рядом с нами. Спасибо Декарту, который о них, видимо, и не помышлял.
polenadisto: (глазъ)
Вот надо уже признать, что среди прочих наук и около я теперь еще активно интересуюсь еще и метаматематикой.
Уже с коллегой на кафедре обсуждали - не организовать ли, в дополнение к киноклубу им. Креславского и лингвоклубу «Pacan'» еще и подпольный метаматематический кружок?
polenadisto: (hairs)
Век живи - век учись.

Уж сколько рассказываю на статистиках всяких, что расстояния бывают разные. И даже иногда упоминаю общую формулу расстояния Минковского, откуда остальные выводятся как частные случаи.
И даже с ученичками обсуждаем, что они сами в жизни иногда разными мерами расстояний ползуются (и даже обсуждаем, почему расстояние городских кварталов - оно манхеттенское, а не бутовское).

Но идея наглядно показать представления о равноудаленности в разных мерах почему-то в голову не приходила (благо это маленький кусочек объяснения кластерного анализа). Красота же!



Тут вам и городские кварталы (p=1), и привычное всем евклидово расстояние (р=2) и даже расстояние Чебышёва (р=∞).
Теперь буду показывать, наверное.
polenadisto: (bat)
Вчера одна бывшая ученица, ныне студентка биофака, пожаловалась, что математика для нее напоминает язык ифкуиль. Это такой искусственный язык мозгодробительной сложности (вот тут есть перевод авторского сайта на русский), автор которого пытался создать язык, напрочь лишенный двусмысленности (вот здесь можно прочитать подробнее, пересказывать не буду). У него и другие задачи были, но сейчас важна именно эта.

Так вот, вышеупомянутая студентка сказала, что, мол, в математическом языке "нет пространства для фантазии" - определения такие, что ни вправо, ни влево не шагнешь.

Что ж, на мой взгляд, она проникла в суть.
polenadisto: (Eristalis)
Вчера ко мне опять наведались студенты биофака на предмет помощи от меня с разъяснением матана. Новые первокурсники, мои еще недавние ученики.
Была среди них и победительница Всероса, которая еще в десятом классе по сути поступила на биофак. И даже подумывавшая о Физтехе - поэтому я удивился, что ей моя помощь тоже понадобилась. Однако у нее был, по сути, всего один вопрос, зато, пока я был занят, она ответила почти на все вопросы своих вчерашних одноклассников (я краем уха слушал, что она им вещала), а потом еще и мне помогла разъяснить им что-то.
А так эта олимпиадница попросила рассказать, как связаны пределы (изучаемые сейчас на биофаке) и производная (изученная в школе без строгого определения и еще не изученная на биофаке), что такое дифференциал, и зачем после каждого интеграла в конце ставится dx - из школьного курса это действительно может остаться неясным.
Но что самое прекрасное: она спросила, когда их на биофаке будут обучать всяким интегралам по контуру и прочим премудростям интегрального исчисления. И была слегка обескуражена, что дальше "простых" интегралов программа биофака не идет.

А потом спросила - как я сам их изучал? А я их особо-то, кхм, и не изучал...

Приятно, что и такие люди есть среди наших студентов!
polenadisto: (bat)
Частенько от биологов слышно такое возражение против матмоделирования, что, мол, всех факторов не учтешь и потому-то математические модели малополезны. Но познавательная польза-то от них в ином: в том, что они показывают, что для возникновения каких-то явлений НЕ необходимо множество факторов (которое есть завуалированное наименование незнания, а то и непознаваемости), а хватает какого-то минимума. И тут как раз неучитывание многих реальных воздействий оказывается плюсом.
polenadisto: (hairs)
Приближенное значение числа е 2,718281828 иногда предлагают запомнить через "удвоенный год рождения Льва Толстого". Собственно, я так год рождения писателя запомнил, но не об этом речь.

Рассказал об этом сегодня школьникам, на что они посмеялись: "А, понятно теперь! Ln - это "Лев Николаевич"!
polenadisto: (hairs)
Сегодня одна наша кафедральная аспирантка поведала, что недавно на какой-то школе по самоорганизации (кажись) выяснила, что помнит, как анализировать диффуры, изображающие динамические системы (ну там, линеаризация всякая, фазовый портрет...)

Так что не надо тут ля-ля.
polenadisto: (hairs)
Рассказывал вчера юным эволюционистам-третьекурсникам про эйлеровы и гамильтоновы графы.
В частности, упоминал теоремы о том, что "почти все графы - гамильтоновы", и "эйлеровых графов почти нет". Дал и более строгие формулировки, про соотношение мощностей множеств эйлеровых E(p), гамильтоновых H(p) и всех графов G(p) для разных числе вершин p:




Потом спросил - какие формулировки им понятнее и ближе, с пределами или на простом бытовом языке? Так вот, что интересно, трое из четырех сказали, что с пределами лучше.
А вы говорите - биологи...
polenadisto: (Default)
Еду в Москву к школьничкам, никого не трогаю - и при выходе из лёгкой дрёмы в голове рождается простенькая, но полезная задачка по теорверу "на понимание". Странно, что раньше не придумал - и вроде нигде не встречал.

Пусть вероятности событий А и В равны 20% и 30% соответственно. Каковы минимально и максимально возможные вероятности события АВ, т.е. пересечения событий А и В? Решить эту же задачу, если вероятности А и В составляют 60% и 70%.

И ведь в этом учебном году теорвкр не вёл, только матстаттолько хардкор. Ну ничего, для следующего года пригодится...
polenadisto: (bat)
Когда еще в курсе теорвера рассказывают о параметрах случайных величин, как-то стороной обходят причину того, что основным параметром разброса является дисперсия, то есть средний квадрат отклонения от среднего (да, точнее говорить про математическое ожидание, чем про среднее, но тут сойдет и так).
Вначале обычно бойко доказывается, что бессмысленно использовать среднее отклонение от среднего - ибо оно равно нулю для любой случайной величины (на то оно и среднее!). После чего говорится, что вот - чтобы положительные и отрицательные величины друг с другом не аннигилировали. Правда, в итоге показатель разброса оказывается несоизмерим с самой величиной и ее средним значением: меряете вы длину - а дисперсия оказывается площадью, меряете объемы - а дисперсия вообще шестимерными гиперобъемами оказывается! Да, из дисперсии извлекают корень и получают среднеквадратичное отклонение. Но почему исходно не взять, например, модуль?! Что за прихоть математиков?
Помнится, когда я спросил своего преподавателя Мамбы на биофаке, почему не модуль - он ушел от ответа. Ну я так и оставил это дело.
Потом как-то Николай Николаевич Константинов (если кто не знает: ссылка 1 ссылка 2) на беломорской практике биокласса обронил, что, мол, дисперсия в квадрате не потому, что надо положительные и отрицательные отклонения спасти от гарантированного взаимного уничтожения - а потому что "иначе у Гаусса теория не получилась"! Я тогда почему-то вдаваться в детали не стал, но сейчас уже несколько лет разъясняю школьникам и студентам пользу именно такой странной дисперсии (как Гаусс или кто еще из отцов теорвера до этого дошел - всё еще не знаю).

Есть у дисперсии замечательное свойство: дисперсия суммы независимых случайных величин равна сумме их дисперсий. Проще говоря, дисперсию можно раскладывать на компоненты, объясняющие ту или иную долю общей вариации. На это строится и дисперсионный анализ, и метод главных компонент, и количественная генетика - и много чего еще!
А ведь таким свойством не обладает ни гипотетический средний модуль отклонения от среднего, не соизмеримый со средним квадратный корень из дисперсии
polenadisto: (глазъ)
Вчера в ходе обсуждения со школьниками олимпиадной задачи по геометрии (это не мои профессиональные обязанности, есличо) понял один любопытный момент.

Вот есть задача про треугольник, в которой требуется числовой ответ. Причем понятно, что треугольник может быть чуть ли всяким - хоть остро-, хоть тупоугольным, хоть еще каким. Но в итоге требуется вписать в бланк число, являющееся ответом. И тут мы понимаем, что этот ответ - единственный, ибо просят вписать только ответ, а не, допустим, разность максимального и минимального из возможных значений. Нов частном случае (допустим, равностороннего, или там прямоугольного, или еще какого треугольника) задачу решить довольно легко. И логично решать именно этот случай, а не мучиться с произвольным треугольником.
Вот такая вот завуалированная "теорема о существовании и единственности решения".

Или тут что-то не так?

April 2017

S M T W T F S
      1
23 45 678
9101112131415
16171819202122
23242526272829
30      

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 25th, 2017 08:53 am
Powered by Dreamwidth Studios