<https stackoverflow com questions 77005993 in kedro pyspark Kedro #questions-so

<in kedro / pyspark how to use MemoryDataset> I am...

rss

08/30/2023, 8:08 AM

in kedro / pyspark how to use MemoryDataset I am trying to use a MemoryDataset with kedro, in order to not save the intermeiate result to disk. # nodes.py def preprocess_format_tracksessions(tracksess: DataFrame, userid_profiles:pd.DataFrame , parameters: Dict) -> MemoryDataset: In the pipeline I am defining the node output and inputs: # pipeline.py def create_pipeline(**kwargs) -> Pipeline: return pipeline([ node( func=preprocess_format_tracksessions, inputs= ["track_sessions",...

✅ 1

Open in Slack

Previous Next