logo

30.07.19

4 причины публиковать статьи о программном обеспечении, даже если вы не являетесь специалистом в области информационных технологий

Зачастую исследователи приходят к выводу, что наборы данных, которые им необходимо проанализировать, настолько необычные или объемные, что не могут быть обработаны с помощью стандартного программного обеспечения. Именно поэтому некоторые исследователи решают создавать собственные коды / программы. В результате, в качестве побочного продукта создаются индивидуальные программы, используемые для достижения значимых и оригинальных научных результатов.

Однако за последние несколько лет произошли перемены. Прошли времена, когда научное программное обеспечение использовалось исключительно на личном веб-сайте разработчика или публиковалось в узкоспециализированных журналах по информатике. Действительно, почему бы не получить должное за время, потраченное на разработку собственного кода? В конце концов, написание кода зачастую занимает большую часть времени, а научные работы являются «попросту» результатом разработанного кода.

Неудивительно, что все большее количество статей о программном обеспечении публикуется в обычных научных журналах. При этом, такие статьи характеризуются значительным количеством прочтений и цитирований (как вы увидите ниже, количество прочтений и цитирований действительно велико). Подводя итог, можно отметить, что статьи о программном обеспечении активно публикуются и будут публиковаться в будущем! Ниже приведены четыре причины, по которым вы должны читать такие статьи или заняться их написанием.


1. Рост количества статей о программном обеспечении
Несмотря на то, что в течение многих лет наблюдается рост количества научных публикаций практически во всех дисциплинах, количество публикуемых статьей о программном обеспечении опережает данные темпы роста. Так, количество статей о программном обеспечении растет более высокими темпами, чем исследования в таких "горячих" научных и общественно-значимых областях как диабет, солнечная энергия и климат.
Статьи о программном обеспечении больше не являются прерогативой журналов по информатике. Действительно, подобного рода статьи публикуются во всех научных дисциплинах, от инженерии и физики до биохимии, генетики, молекулярной биологии и медицинских наук.

Статьи, опубликованные в различных научных областях (Источник: Scopus).

Доклад Elsevier об исследованиях в области искусственного интеллекта, опубликованный некоторое время назад, описывает похожую картину: за последние десять лет количество исследований в области искусственного интеллекта росло на 5,3 процента в год, а за последние 5 лет данный показатель составил целых 12,9 процента.

Статьи, опубликованные в области искусственного интеллекта (Источник: Scopus).

2. Статьи о программном обеспечении привлекают цитирования
Публикация статей о программном обеспечении в научных журналах значительно повышает вероятность обнаружения, использования и цитирования вашего программного обеспечения. Читатели могут узнать о статье различными способами: с помощью функции рекомендации статей на таких платформах, как ScienceDirect, путем получения статьи в Mendeley от коллег, или благодаря установленным оповещениям о публикации новых и актуальных статей.

Это действительно работает. По данным Scopus, из 10 наиболее цитируемых статьей, опубликованных за последние 30 лет, четыре являются статьями о программном обеспечении. Среди них статья, набравшая целых 69203 цитирования. Это работа профессора Джорджа Шелдрика, разработчика программы SHELX, которая используется для кристаллографии макромолекул. Автор разработал первую версию этого программного обеспечения еще в 1970-х годах, и на протяжении многих лет писал о ней в различных книгах по информационным технологиям и публиковал отдельные научные статьи в журналах, в которых описывал только определенные функции и улучшения кода. Однако в 2008 году он собрал всю информацию воедино и опубликовал обзорную статью под названием "A short history of SHELX"(«Краткая история SHELX»). По количеству полученных цитирований он стал одним из самых цитируемых авторов в своей области.

Еще одной привлекательной особенностью статей о программном обеспечении является то, что цитирования, как правило, не прекращают появляться с течением времени. Например, статья, описывающая BLAST (средство поиска основного локального выравнивания), была опубликована в журнале молекулярной биологии Elsevier еще в 1990 году и на сегодняшний день получила более 54152 цитирования. В связи с тем, что программное обеспечение все еще широко используется в исследованиях генома, в первые месяцы 2019 года она получила более 900 дополнительных цитирований.

3. Статьи о программном обеспечении расширяют границы возможного
В последнее время мы наблюдаем появление более инновационных способов публикации статей о программном обеспечении. Например, журнал открытого доступа SoftwareX занимается публикацией только статей о программном обеспечении для всех научных областей. Журнал не требует у своих авторов подготовку научных статей в стандартном формате, а публикует так называемые оригинальные публикации о программном обеспечении, для чего был создан специальный шаблон. Авторам предлагается предоставить лишь краткое описание новизны и оценку научной значимости их кода, но основной упор делается на сам код, чьи характеристики указываются в его метаданных. Кроме того, авторы должны поделиться своим программным обеспечением, разместив его в общедоступном хранилище, архиве и т. д. Журнал также имеет специальную страницу SoftwareX на GitHub, которая содержит все коды. Помимо этого, программное обеспечение проходит процедуру рецензирования.

Рецензируемое программное обеспечение? Все верно, этот журнал действительно просит своих рецензентов проверять коды и разработал для этого специальные рекомендации. Чтобы ускорить процесс рецензирования, журнал недавно запустил пилотный проект с CodeOcean, «платформой, предоставляющей исследователям и разработчикам возможность с легкостью находить коды, опубликованные в научных журналах и конференциях, обмениваться ими и работать с ними». Авторы SoftwareX загружают свои коды в CodeOcean, а рецензенты могут либо просто проверить их работоспособность и получить результат, либо построчно проверить сам код (для настоящих энтузиастов). Благодаря возможности проверять работоспособность кодов, на платформе CodeOcean размещаются только работающие коды.

4. Пользователи программного обеспечения лояльны используемым ими программам
Анализ статистики использования некоторых известных пакетов программного обеспечения, широко применяющихся в определенных исследовательских сообществах, показывает, что пользователи очень лояльны к используемому программному обеспечению. Исследователи постоянно используют одну и ту же программу для своих исследований (что в какой-то степени может считаться очевидным с учетом того, что программный пакет рассматривается программой по умолчанию для использования в данной области). Кроме того, с выходом новой версии программного обеспечения, количество цитирований обновленной версии начинает расти, что указывают на переход пользователей от предыдущей версии программы к новой.

Лояльность пользователей может быть проиллюстрирована на примере следующих журналов: журнал по программному обеспечению SoftwareX (публикует GROMACS), журнал по биологии BioInformatics (CLUSTAL) и журнал по вычислительной физике Computer Physics Communications (PYTHIA).

GROMACS представляет собой достаточно часто используемую программу для моделирования белков, липидов и нуклеиновых кислот. CLUSTAL состоит из серии компьютерных программ, используемых для множественного выравнивания последовательностей. PYTHIA - это программа моделирования процессов столкновения частиц. На веб-сайтах каждой из соответствующих программ опубликованы полные списки официальных публикаций и инструкций о том, какую версию нужно использовать и как ее цитировать. И, по всей вероятности, пользователи активно читают эти публикации и инструкции!

В случае с GROMACS мы видим явное смещение цитирований от одной версии к другой при каждом выпуске новой версии. Случается, что "старые" версии продолжают набирать цитирования вместе с новой версией. Это происходит, когда либо не указывается номер версии программы, либо если «старая» версия имеет те же полезные функциональные возможности, что и новая. Таким образом, при выпуске новой версии программы пользователи сразу же начинают на нее ссылаться. Однако если они продолжают ссылаться на старую версию, то у них, как правило, есть на то веские причины.

В случае с GROMACS мы видим явное смещение цитирований от одной версии к другой при каждом выпуске новой версии.

CLUSTAL более явно демонстрирует такое поведение пользователей. Представленный ниже график хорошо иллюстрирует, что исследователи использовали (и цитировали) CLUSTAL W в соответствии с инструкциями, опубликованными на веб-сайте разработчика. Однако как только поддержка CLUSTAL была прекращена, три разных пакета, указанные разработчиком как преемники пакета CLUSTAL (CLUSTAL OMEGA, MUSCLE и MAFFT), начинают набирать обороты и количество цитирований.

Поведение пользователей CLUSTAL, 1994-2018 гг.

Поведение пользователей пакета PYTHIA также демонстрирует явный переход к использованию более новых версий. Стоит отметить, что авторы PYTHIA опубликовали четыре из пяти основных выпусков в одном журнале, благодаря чему пользователи знают, где проверять наличие новых версий и обновлений программного обеспечения.

Поведение пользователей пакета PYTHIA также демонстрирует явный переход к использованию более новых версий.

Для рассмотренного программного обеспечения во всех трех примерах, а также для другого проанализированного нами программного обеспечения, общее количество ссылок продолжает расти, демонстрируя рост в течение многих лет как в процессе разработки, так и при эксплуатации программного обеспечения (см. графики ниже).

Общее количество цитирований статей о программном обеспечении продолжает расти с течением времени. (Источник: GROMACS, CLUSTAL и PYTHIA).

Заключение
Статьи о программном обеспечении появляются повсеместно и лидируют с точки зрения количества цитирований. Сотрудники редакций журналов Elsevier планируют реализацию дополнительных проектов, нацеленных на удовлетворение потребностей авторов и читателей. В результате, вы сможете легче, чем когда-либо, получить должное за проделанную вами сложную работу.

Статьи с большим количеством цитирований
Basic local alignment search tool (1990), Journal of Molecular Biology – 54 152 цитирования на сегодняшний день
EMBOSS: The European Molecular Biology Open Software Suite (2000),Trends in Genetics – 4 782 цитирования на сегодняшний день
A brief introduction to PYTHIA 8.1 (2008), Computer Physics Communications – 2 338 цитирований на сегодняшний день (первая версия статьи под названием “High-energy-physics event generation with PYTHIA 5.7 and JETSET 7.4” была также опубликована в журнале CPC в 2003 г., и на сегодняшний день имеет почти 2 700 цитирований)
GADGET: a code for collisionless and gasdynamical cosmological simulations (2001), New Astronomy – 1 057 цитирований на сегодняшний день

Лидеры по количеству цитирований с 1990 г.
Статьи, выделенные жирным шрифтом, посвящены программному обеспечению.

Год публикации
Название статьи
Авторы Журнал Количество цитирований за все время
1996 Generalized gradient approximation made simple Perdew J.P., Burke K., Ernzerhof M. Physical Review Letters 794,81
2001 Analysis of relative gene expression data using real-time quantitative PCR and the 2<sup>-ΔΔC</sup>T method Livak K.J., Schmittgen T.D. Methods* 73,459
1993 Density-functional thermochemistry. III. The role of exact exchange Becke A.D. The Journal of Chemical Physics 72,691
2008 A short history of SHELX Sheldrick G.M. Acta Crystallographica Section A: Foundations of Crystallography 69,203
1990 Basic local alignment search tool Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. Journal of Molecular Biology* 54,760
1997 Gapped BLAST and PSI-BLAST: A new generation of protein database search programs Altschul S.F., Madden T.L., Schaffer A.A., Zhang J., Zhang Z., Miller W., Lipman D.J. Nucleic Acids Research 51,669
1994 CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice Thompson J.D., Higgins D.G., Gibson T.J. Nucleic Acids Research 49,512
1996 Efficient iterative schemes for ab initio total-energy calculations using a plane-wave basis set Kresse G., Furthmuller J. Physical Review B - Condensed Matter and Materials Physics 43,229
2004 Electric field in atomically thin carbon films Novoselov K.S., Geim A.K., Morozov S.V., Jiang D., Zhang Y., Dubonos S.V., Grigorieva I.V., Firsov A.A. Science 35,309
1997 Processing of X-ray diffraction data collected in oscillation mode Otwinowski Z., Minor W. Methods in Enzymology 34,446


*журналы Elsevier

Оригинал данной статьи был опубликован на английском языке на портале ElsevierConnect. Авторы Chiara Farinelli, PhD и José Stoop. 


Все новости

logo

© 2019 Elsevier, кроме контента, предоставленного третьей стороной.
На данном сайте используются cookie-файлы. Если вы не согласны с их использованием или хотите получить дополнительную информацию, посетите нашу специализированную страницу.

Term & Conditions Privacy Policy

logo