У меня есть три столбца «Имя», «Манекен успеха» и «Дата». Для каждого ИМЯ я хочу проверить ПРОШЛЫЙ УСПЕХ для этого ИМЯ.
Так, например, если имя «Питер» встречается три раза, каждый раз я хочу подсчитать количество «Питер» с «Успехом == 1», а дата произошла раньше.
Пример вывода, который мне нужно получить для столбца «Прошлый успех».
Name Success Date Past Success
David 1 2018 1
Peter 0 2017 3
Peter 1 2016 2
David 1 2017 0
Peter 1 2015 1
Peter 0 2010 1
Peter 1 2005 0
Peter NA 2004 0
Есть ли способ сделать это быстро?
Также мне нужно, чтобы это было очень быстро, потому что мои данные огромны.
Что я сделал, так это отсортировал свои данные на основе имен и дат и сравнил каждое наблюдение со 100 наблюдениями ранее (поскольку максимальная частота имен составляет 100).
Пожалуйста, сообщите, если есть лучший способ сделать это.
rle()
- person DanY   schedule 05.04.2019