ny_quant: (Default)
[personal profile] ny_quant
Если верить Таймс, то наш соотечественник скоммуниздил лишь небольшую часть голдмановского кода

Хотя, как говорится, меня снедают смутные сомнения. Гигабайт (с гаком) кода это, грубо говоря, 20 миллионов строк кода, т.е всего вдвое меньше, чем Windows XP. Если писать по 100 строк в день, то получтся порядка 80 человеко-лет работы. А ведь надо же еще тестировать и поддерживать. Что-то я не понимаю, как это возможно в условиях сравнительно небольшого департамента.

Date: 2009-08-28 06:49 am (UTC)
From: [identity profile] http://users.livejournal.com/_foreseer/
Это небось репозитарий был. А там всякие внешние библиотеки, тестовые данные, предрасчитанные таблички итп. Да и 80 человеко лет вроде немного? 25 человек на 3 года это небольшой проект вроде

Date: 2009-08-28 02:17 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
http://ny-quant.livejournal.com/147624.html?thread=499112#t499112

Date: 2009-08-28 02:17 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Если с тестовыми данными и табличками, то может быть сколько угодно, но речь как будто шла именно о коде.

Кстати, я на бегу обсчитался: 20,000,000 / (100*250) = 800 человеко-лет.

80 соответствует 2 миллионам строк кода. Вы когда-нибудь имели дело с библиотекой такого размера? На прошлой службе у нас было не больше полумиллиона и я не могу передать словами как мы задолбались поддерживать этот продукт. Причем, сложность поддержки растет скорее всего нелинейно.

Хотя, конечно, коды бывают разные. Сам не пробовал, но знакомые говорили, что, скажем, на Коболе можно очень много (по объему) написать. Но HFT код скорее всего написан на C#. Нипочём не поверю в гигабайт, и не уговаривайте.

Date: 2009-08-28 02:42 pm (UTC)
From: [identity profile] http://users.livejournal.com/_foreseer/
Ну вот у нас сейчас в отделе ~1GB "исходников", т.е. того, что лежит в репозитарии с исходниками. Из них .h/.cpp файлов - 160MB (ie ~4mln lines). Думаю, HFT от поисковой сиситемы несильно по структуре отличается, так что и там расклад скорее всего такой же.

Не сказал бы, что особенно сложно поддерживать все это добро. Это скорее от качества, а не от количества зависит. Можно и 100K так написать, что у поддержки дел невпроворот будет :)

Если это и правда 1Gb именно исходников, то мое почтение.

Date: 2009-08-28 06:26 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Так я узнал объем исходников Яндекса. Кому бы продать столь ценную инфу? :)

От качества действительно зависит сильно. В том числе и от качества поддерживающего. Если, например, первоначальные разработчики полагали, что иерархии классов с шаблонами - это хорошо и правильно, а поддерживающие думают как раз наоборот ...

Я и говорю, что моё почтение, особенно если учесть, что у Вас там, я думаю, куда больше народа работает над этими 4 миллионами строк.

Date: 2009-08-28 08:38 pm (UTC)
From: [identity profile] http://users.livejournal.com/_foreseer/
я бы даже сказал бесценную инфу :)

конкретно на этот код потрачено ~200 человеко-лет разработки за ~10 календарных лет. Т.е. те же ~100 строк в день. Если еще время менеджеров/тестеров/итп накинуть, то затраты удвоятся

Date: 2009-08-28 04:11 pm (UTC)
From: [identity profile] the-white-man.livejournal.com
Я сильно подозреваю, что те, кто писАл статью весьма слабо представляют, о чем они говорят. Мне вообще вся эта история кажется очень подозрительной. Скорее похоже на попытку любыми силами не позволить уйти к конкуренту.
По моему мнению (disclaimer: Я ошибался в прошлом, скорее всего буду ошибаться в будущем, и, весьма вероятно, что неправ сейчас :) ) все это полу-правда, как обычно. Мне представляется, что ситуация была примерно следующая: тов Алейников (не совсем простой программер, с з/п 400К :) ) разработал, или учавствовал в разработке определенной стратегии в ГС. Когда выяснилось, что стратегия успешно работает, он предложил кому-то (или ему предложили) создать подобную стратегию в другом месте. За что ему, естественно, хорошо заплатили (новая з/п - 1.2М/год). Не могу не вспомнить тут Обамиху, которую тоже взяли на работу в универ с окладом в 300К, когда молодой сенатор пробил специальный грант в неск ММ этому универу. ГС, естественно, такое положение дел совсем не понравилось, и они лихорадочно искали как бы предотвратить утечку. И тут, удача, обнаружилось, что он скачал какие-то файлы (на сервер в Германии - на ум приходит rapidshare :) ). Если бы он и вправду хотел тихонечко стянуть эти файлы, что ему стоило бы просто скопировать их на USB-key :) Ну и они воспользовались этой оплошностью, чтобы прижать его (и его новых работодателей). Теперь им будет не доказать, сделал ли он все с нуля, или использовал что-то украденное. В любом случае, ГС наверняка сможет получить injunction и приостановить разработку на достаточно долгое время, если не похоронить ее окончательно.

Мне кажется, что он скачал это для каких-нибудь совершенно безобидных целей. Например, чтобы дома поработать :) Но то, что он не собирался "красть секретный код" я почти уверен. "Секретный код" это вообще нонсенс в наше время. Если он знал, ЧТО надо делать, то написать для этого код это просто дело техники. Как известно, самая большая проблема, это знать где правильно дырку просверлить :). И вовсе не обязательно тырить для этого дрель у работодателя ;)

Date: 2009-08-28 04:43 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Вы только не обижайтесь, но Вы выбили ровно ноль очков :)

Начну с того простого факта, что во всех банках, не только в злобном ГС, все внешние устройства (кроме CD reader) наглухо отключены. Насколько возможно, все сайты и серверы, куда можно загружать файло, заблокированы. Общие правила запрещают даже ходить в такие места. Есть спецотдел, который выборочно проверяет кто куда ходит и в случае нарушения могут впендюрить.

Предыдущая статья сообщала, что Алейников неделю искал незаблокированный сервер. Когда выложил, он стер bash history, чем и вызвал подозрения, приведшие к провалу.

Если Вы почитаете его резюме на LinkedIn то убедитесь, что он не более, чем сетевик. Т.е. он работал в IT, а с торговыми алгоритмами дела иметь не мог, т.к. ничего он об этом не знает. Такой человек вполне может зарабатывать 400К в Голдмане, но 1.2М не может нигде. Кроме как если ему есть что продать.

Взаимная утечка и перетечка мозгов между банками - дело настолько повседневное, что с этим никто и не думает бороться. Тем более, когда речь идет о столь малозначительной фигуре.

Секретные коды, безусловно, существуют. Во-первых потому, что они таки охраняются. Во-вторых потому, что далеко не каждый согласен такой ворованый товар купить. Ни банк, ни серьёзный хедж-фонд на такое никогда не пойдут, т.к. если попадешься, то в суде не расплатишься. Не говоря уже об ущербе для репутации, о которой (что бы об этом не думали) очень заботятся.

Только при нашем специфически русском менталитете можно пойти на такую аферу. Важно, что покупателем был новый фонд, организованный русским трейдером, только что ушедшим из Цитадели. Вот такая шарашкина контора и может заплатить миллион за ворованный софт.

А переписать можно, если знаешь как, это точно. Только на это уйдут годы труда.

Date: 2009-08-28 05:11 pm (UTC)
From: [identity profile] the-white-man.livejournal.com
Я не обижаюсь :)

Как я отметил, я вполне могу ошибаться. Я не слежу за этим делом очень внимательно, так, по ходу дела, по статьюм в NYT and WSJ :) Потому на Линкед ин не ходил, хотя, наверное, стОили до того как спорить и высказывать свое мнение. Но времени было жалко ;) Как дела обстоят в крупной инвестиционной конторе, я тоже представляю. Хотя в последнее время я больше работал в хедж-стартапах :)

Я вовсе не считаю, что мистер Олейников белый и пушистый. Я так же согласен, что репутация в нашем бизнесе дело не менее важное, чем знания и умения. Как говорил один из моих коллег, "наш бизнес - это доверие". Я абсолютно согласен, что ему не просто так заплатили деньги, и, скорее всего, он продал какие-то секреты.

Но вся эта история очень странно выглядит. Очень похоже, что да, он не прав. И ГС это знает. Но смогли его прищучить только на этом проколе. Поэтому и раздули такую историю из этого инциндента. Да, внешние устройства заблокированны. Но для ИТ человека, который может "стереть bash history" это не так сложно разблокировать или обойти (например, можно загрузиться с СД, поменять в лаптопе на день HDD со своей системой, использовать SSH tunnel или VPN на домашний раутер на 443 порт, сфотографировать экраны с кодом, на худой конец и тд. Понятно, что каждый из этих способов в отдельности можно заблокировать - хотя некоторые и не очень просто).

Секретные коды это скорее секретные алгоритмы, которые могут быть reverse engineered from code. На самом деле, если он таки просто ИТ чувак, который имел доступ к репозиторию, то я тогда могу понять, зачем ему коды (т.к алгоритмы были ему не понятны/не известны). Мой постулат (похоже, не верный :) ) был в том, что он был ведущим разработчиком этой системы, и следовательно имел хорошее представление об алгоритме.

С малозначительными фигурами, естественно, никто не борется. Мне казалось, sorry for my ignorance, что он было значительной фигурой. А с такими борются, и очень активно. Особенно если есть возможность чем-то зацепить.

Вот с годами труда, я, пожалуй, не соглашусь. Если точно знать, что надо сделать и однажды пройти по этому пути, то второй раз на порядки быстрее.

Date: 2009-08-28 06:14 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Даже 36 MB, которые он украл, это порядка сотни тысяч строк кода, которые писали многие люди в течение многих лет. Никто всего этого в деталях не знает. Знаешь хорошо то, что писал сам. Более-менее - то, что поддерживал. Остальное - понаслышке, на уровне общей функциональности, но никак не деталей. Переписать такую систему сначала очень сложно.

Алейников имел должность вице-президента. Как Вы понимаете, их Голдмане тысячи.

Profile

ny_quant: (Default)
ny_quant

August 2022

S M T W T F S
 1234 56
78910111213
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 23rd, 2025 05:55 pm
Powered by Dreamwidth Studios