Привет, у меня есть скрипт Python, который использует библиотеку dask для обработки очень большого фрейма данных, большего, чем физическая память. Я замечаю, что задание прекращается в середине выполнения, если использование памяти в течение некоторого времени остается на уровне 100% компьютера.
Это ожидается? Я бы подумал, что данные будут перенесены на диск, и на диске останется много места.
Есть ли способ ограничить общее использование памяти? Спасибо
РЕДАКТИРОВАТЬ:
Я также пробовал:
dask.set_options (доступная_память = 12e9)
Это не работает. Похоже, это не ограничивало использование памяти. Опять же, когда использование памяти достигает 100%, задание уничтожается.
dd.compute()
, гдеdd
— ваш фрейм данных dask. - person jpp   schedule 24.01.2018