Имхо:
1. В данном "тестировании" неразглашение коллекции может быть прикрыто чем угодно, начиная от статьи 273 УК РФ. Однако MD5 семплов под эти требования не подпадают и в теории должны быть публично известны. В противном случае этот тест не более чем "сезонное мартовское обострение" (правда обычно фигрурирует коллекция на 1000 вирусов), так как совершенно не ясно, что там - креки, кейгены, шутки, фолсы по детекту антивируса X, тулбары какие-то и т.п. Публикация базы MD5 сняла бы этот вопрос (причем если посмотреть посты выше, то вопрос о том, что за семплы, откуда брались, как проверялись и т.п. задается в каждом втором посте)
2. Пост Юрия Паршина про виртуалку ушел в оффтопик, а зря. Дело в том, что любая основанная на эмуляторе технология исследования малварей под виртуалкой может "просесть" на порядок (так как получим "виртуальный запуск малвари под виртуальной машиной" ). Эмулятору же никто не даст изучать семпл 3 часа - и при одинаковой квоте времени на изучение семпла на реальном железе он изучит семпл и найдет зловредное поведение, на виртуалке - банально не успеет доэмулировать до нужного места