Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Microsoft Office (Word, Excel, Outlook и т.д.) (http://forum.oszone.net/forumdisplay.php?f=115)
-   -   Как сгруппировать строки в Excel по данным столбцов (телефон, сайт, соц.сети), ВПР не (http://forum.oszone.net/showthread.php?t=349311)

megagogo 01-08-2021 15:47 2963333

Как сгруппировать строки в Excel по данным столбцов (телефон, сайт, соц.сети), ВПР не
 
Здравствуйте!
Пожалуйста, если тут на форуме есть кто-то, кто разбирается в Excel, или есть хоть какие-то предположения, как можно это реализовать, подскажите.... Вопрос очень сложный, уже не первый месяц в поисках решения, но пока ничего толком не смог придумать, поэтому решил задать вопрос на форуме.
*********
Проблемный файл прикрепляю, чтобы вам было более понятно, о чем речь:
https://yadi.sk/d/z0FNjYrN1e6UDA
*********
Суть такая: есть ~30.000 магазинов.
Каждый магазин = отдельная строка в таблице.
НО среди этих 30.000 магазинов есть большое количество СЕТЕЙ (т.е. сеть магазинов "4 лапы" например, очень большая, и все магазины этой сети разбросаны по таблице конкретно).
********
В таблице есть следующие столбцы, к которым я пытался применить формулу ВПР, но не очень успешно, т.к. все равно не получается объединить все магазины...

У меня получается сделать например так:
- Формула ВПР на сайты (т.е. если есть строки, у которых есть 1 URL общий, то их сгруппировать).
- Формула ВПР на одинаковые номера телефонов (т.е. если в таблице есть строки с одинаковыми телефонами, то их я могу сгруппировать).
- Формула ВПР на одинаковые ссылки на соц.сети (т.е. если соц.сеть Вконтакте, Инстаграм, фейсбук и т.п. сходятся - то они сгруппировываются легко).

НО этот способ работает не до конца... Потому что бывает ситуация, постараюсь описать максимально подробно:
-- Строка №1 - 3 телефона, нет никаких дополнительных данных.
-- Строка №10 - 3 телефона (1 из телефонов сходится с строкой №1), но есть ссылка на сайт.
--- Строка №15 - 3 телефона (телефоны не сходятся с строкой №1 и №10), но сайт сходится со строкой №10.
--- Строка №20 - 3 телефона (они не сходятся с другими), сайта нет, но есть инстаграм (которого нет в строках №1, 10, 15).
---- Строка №25 - 1 телефон (одинаковый со строкой №20), но нет инстаграма, есть ссылка на Вконтакте (которых не было ранее).
---- Строка №30 - 3 телефона (уникальных), есть ссылка на Вконтакте.

И так можно продолжать в принципе дальше, но суть такая: понятно, что если телефон, сайт, соц.сети одинаковые, то это одна компания... НО как их объединить? Строки №1, 10, 15, 20, 25, 30 (из примера, это все образно, чтобы расписать суть проблемы). Через ВПР я не представляю, как это все отфильтровать.

(+ пожалуйста, не пишите ответы что-то вроде - купи нормальную базу, и не думай о том, как фильтировать данные), потому что в любом случае, хотелось бы самому прежде всего разобраться с этой проблемой, т.к. даже в покупных базах, если их будет много, то можно столкнуться с такой же ситуацией...

Буду рад любой помощи и совету, как это реализовать, если кто-то вообще когда-то занимался подобным)

megaloman 01-08-2021 17:20 2963342

megagogo, А в чем суть: Вам надо сгруппировать (то есть расположить рядом) магазины, если:
- хотя бы один номер телефона совпадает;
- или хотя бы один сайт одинаковый (а телефоны что, при этом могут быть разные?);
- или хотя бы одна соцсеть совпадает?

Что в ответе: реорганизованная таблица?

Писать про то, что прежде чем данные вносить в таблицу надо иметь хотя бы одно уникальное поле для сети, например ID сети и никакая покупная база не позволит упорядочить хаос. Если удастся реорганизовать таблицу, по любому какой-то общий признак необходимо ввести.

megagogo 01-08-2021 17:25 2963343

megaloman, да, вы все правильно написали - что нужно все сгруппировать....
Объясните пожалуйста, что вы подразумеваете под "поле признака сети"?
может есть возможность подобную таблицу как-то обработать все-таки? Просто это то, что есть , других данных на сайте нет и спарситься им неоткуда... поэтому и вопрос такой, я уже если честно замучился, уже вроде был близок к решению, но смог сгруппировать только по сайту и по соц.сетям (по отдельности), а как по всем критериям одновременно - не могу додуматься(((

megaloman 01-08-2021 17:52 2963349

Цитата:

Цитата megagogo
а как по всем критериям одновременно »

Вам надо не по всем критериям одновременно (И), а применить логику ИЛИ.
Цитата:

Цитата megagogo
Объясните пожалуйста, что вы подразумеваете под "поле признака сети"? »

Для сети должно быть поле с уникальным признаком обязательным к заполнению.
Я пока не придумал решение, пробую:
сортирую по первому номеру телефона. Вижу, что для номера +7*******686 имеются 15 строк. И у них Email одинаковый.
сортирую по Email, ищу нужный Email и вижу те же 15 строк с телефоном +7*******686


Время: 02:52.

Время: 02:52.
© OSzone.net 2001-