дорогие аквариумисты! с 1.12.2011 сайт aquaria2.ru превращен в памятник. на нем закрыта регистрация, создание новых материалов и комментариев.
активная версия аквариумного сайта теперь доступна по адресу http://aquaria.ru. все материалы и регистрации пользователей aquaria2, созданные до 29.11.2011, блоги, темы форума, комментарии перенесены на новый сайт.
Формат *.pdf изначально не был предназначен для использования в каталогах и рубрикаторах поисковых систем... у него другая задача — представление в электронном виде полиграфической продукции БЕЗ ИСКАЖЕНИЙ, т.е. в том же виде, что и на бумажном носителе, на любом совместимом оборудовании. Подготовили оригинал-макет, и не важно на каком принтере и с какого компьютера распечатываете — результат везде будет сопоставим. Но...
Представьте вы имеете даже 2 многостраничные книги в этом формате — если вам нужно там что-то найти... — устанете листать... А если, вам попался файл в котором не внедрены, например, использовавшиеся нераспространнёные шрифты (или наоборот, у Вас установлен нераспространённый шрифт, вместо общепринятого)... — крякозябры Вам обеспечены и поправить вы в этом файле ничего не сможете... Пример такой ситуации был доступен пользователям Win95 перешедших на WinXP, но ранее пользовавшихся некоторыми шрифтами под предыдущую версию — в новой получили файлы с крякозябрами, притом, что простой подстановкой другого шрифта проблема не лечилась — требовалась РУЧНАЯ перебивка всего текста...
Не говоря о том, что где вы собираетесь, при необходимости, комментировать и обсуждать текст?
А давайте проще... Вот у меня есть, к примеру, кто то просит, я по мылу спульну, мне не жалко..А то, что-то много проблем на сайте из-за пдф..Ни у кого нет, а тут проявляются...
Только если в комментариях...
В самом теле статьи — не место тем фотографиям, которых НЕ БЫЛО в ее бумажном варианте! Точно также как не место там и «подменным» фоткам (новым вместо настоящих).
Полностью согласна. ТОЛЬКО в комментариях. Какая бы красивейшая НОВАЯ фотография не была, она ни как не может быть помещена в статью, причём, новые фотографии надо так и указывать «современная фотография...»
Мне кажется, что объем вообще не должен быть вопросом... Почему бы не сесть на собственный сервер? Комп для этого неужен не слишком мощный, а винты денег уже не такких больших стоят...
а как насчёт хранения PDF файлов на внешних обменниках (ifolder.ru, up.spbland.ru)?
А вот подобные варианты строго идут в жопу!
По целому ряду вполне очевидных причин.
Это подобно хранению семейных сбережений в вокзальной камере хранения. А подробнее, думаю, Слава объяснит, если сие сравнение не достаточно наглядно...
а как насчёт хранения PDF файлов на внешних обменниках (ifolder.ru, up.spbland.ru)?
с указанием ссылок на них?
придумать можно многое. просто я в принципе против pdf для хранения таких материалов. в третий раз повторяю причины: невозможность поиска и нормальной рубрикации.
как времянку их еще можно терпеть. но как концепцию - ???
это совершенно неправильный вариант. т.к. с такими файлами место на хостинге кончится мигом. временно еще можно допустить наличие pdf-ок, до оцифровки, но потом - однозначно в пропасть. возможно, даже, их придется сносить еще раньше.
а как насчёт хранения PDF файлов на внешних обменниках (ifolder.ru, up.spbland.ru)?
с указанием ссылок на них?
И, логично, при возможности, старые статьи, но уже в комментариях, снабдить новыми фотографиями...
Только если в комментариях...
В самом теле статьи - не место тем фоторгафиям, которых НЕ БЫЛО в ее бумажном варианте! Точно также как не место там и "подменным" фоткам (новым вместо настоящих).
В публикациях статей из "АМ" и (его дальнейших инкарнаций) я этой позиции придерживаюсь очень строго. Надо и к остальным публикациям раздела "Статьи" применить это непреложное правило. Все "новоделы" - только в комментах!
Может, среди наших пользователей есть программист, способный придумать конвертор из одного формата в другой?
я сам могу перекинуть ту базу в новую двумя кликами. ну ладно. не двумя. тремя. но нам это не надо. там столько косяков и всякой фигни, что лучше не стоит... потом все равно придется отконвертированный вариант причесывать и доводить до ума теми же ручонками. но с бОльшим риском чего-то про**ать.
Косяки там, насколько я понимаю, только трех типов:
1) - ошибки OCR-распознавания и опечатки (если учесть, в каком "агрегатном состоянии" мы с тобой в старинном 98-м году многие из них сканировали, то не мудрено-с!);
2) - дубликаты (некоторые из статей по загадочным причинам попадали в базу по два раза) - но во-первых их очень мало, а во-вторых ручной перенос от них тоже не спасёт на 100%;
3) - имя-фамилия авторов в разном написании (сначала имя потом фамилия, сначала фамилия потом имя, инициал и фамилия, два инициала и фамилия) - тут всё равно придется вычищать руками, это да.
Но в целом, мне кажется, имеет определенный смысл сначала перенести всю базу, слить ее с нынешней здешней, а уже потом править.
Единственный видимый мной аргумент против такого решения - это возможность при ручном переносе вести ручную индексацию по меткам. Но тут уж вопрос: так ли уж это важно по сравнению со скорейшим объединением баз? Не факт...
В общем, имеет смысл еще раз крепко обдумать все за и против автоматического и ручного переноса...
я считаю правильным не выкладывание pdf, а внесение статей в имеющуюся базу. это позволяет вести их рубрикацию, поиск, обсуждать и комментировать.
я думаю, надо делать двойной (иногда тройной) вариант, например:
3) журнал "Аквариум" 1993 №1 я добавил в "библиографию" как есть (PDF 38Мб)
2) распознаю FineReader-ом, положу на его место (OCR PDF)
1) каждую статью из журнала постараюсь оформить в раздел "статьи"
это совершенно неправильный вариант. т.к. с такими файлами место на хостинге кончится мигом. временно еще можно допустить наличие pdf-ок, до оцифровки, но потом - однозначно в пропасть. возможно, даже, их придется сносить еще раньше.