GPT-4.1与Claude 3.5 Sonnet数学推理能力API实测对比