API——application programming interface
全称为应用程序开发接口,是不同软件系统之间相互通信的桥梁。通过API,开发者可以通过标准化的请求和响应机制,访问服务器上的数据和功能,而无需了解具体的内部实现细节。在python中,编写API通常意味着将函数封装在一个可以通过http请求访问的接口中。
API的类型
①web API:也叫做网络API或HTTP API,允许应用程序通过网络进行交互,web API通常使用HTTP协议,传递JSON或XML格式的数据。例如,天气预报应用可以通过调用一个天气服务的web API,获取当前的天气信息。
②操作系统API:操作系统提供的API允许开发者访问硬件资源或系统服务。例如,windows API允许程序访问文件系统、网络连接、显示图形等操作系统功能。
③库或框架的API:编程语言中的库或框架通常提供API,允许开发者调用其功能。例如,python的requests库提供了简单的API来发起HTTP请求。
④硬件API:一些硬件设备(如显卡、传感器等)也是提供API,共开发者控制或与设备通信。例如,图形API(如openGL、DirectX)用于开发3D图形应用。
python安装:推荐使用python 3.8及以上的版本
Flask或FastAPI框架:这是python中常用的两个web框架,用于快速构建API
test.py
# Import dependencies
import pandas as pd
import numpy as np# Load the dataset in a dataframe object and include only four features as mentioned
url = "http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/train.csv"
df = pd.read_csv(url)
include = ['Age', 'Sex', 'Embarked', 'Survived'] # Only four features
df_ = df[include]# 往下5行的代码不能运行,自己根据df_制作可迭代数据
# iterable = [str(x) for x in df_.dtypes]# Data Preprocessing
categoricals = []
for col, col_type in zip(include, df_.dtypes):if str(col_type) == 'object':categoricals.append(col)else:df_[col].fillna(0, inplace=True)df_ohe = pd.get_dummies(df_, columns=categoricals, dummy_na=True)# Logistic Regression classifier
from sklearn.linear_model import LogisticRegression
dependent_variable = 'Survived'
x = df_ohe[df_ohe.columns.difference([dependent_variable])]
y = df_ohe[dependent_variable]
lr = LogisticRegression()
lr.fit(x, y)# Save your model
import joblib
joblib.dump(lr, 'model.pkl')
print("Model dumped!")# Load the model that you just saved
lr = joblib.load('model.pkl')# 需要再模型训练期间把列保留下来
model_columns = list(x.columns)
joblib.dump(model_columns, 'model_columns.pkl')
print("Models columns dumped!")
api.py
from flask import Flask, request, jsonify
import joblib
import traceback
import pandas as pd
import numpy as np
import sys
import jsonapp = Flask(__name__)@app.route('/')
def hello():return "这是根目录!"@app.route('/predict', methods=['POST']) # Your API endpoint URL would consist /predict
def predict():if lr:try:with open('request.txt','w') as f:f.write(request.json)json_ = request.jsonquery = pd.get_dummies(pd.DataFrame(json.loads(json_)))query = query.reindex(columns=model_columns, fill_value=0)prediction = list(lr.predict(query))return jsonify({'prediction': str(prediction)})except:return jsonify({'trace': traceback.format_exc()})else:print ('Train the model first')return ('No model here to use')if __name__ == '__main__':try:port = int(sys.argv[1]) # 命令行的输入except:port = 12345 # 如果不提供任何端口,则端口被设置为12345lr = joblib.load("model.pkl") # Load "model.pkl"print ('Model loaded')model_columns = joblib.load("model_columns.pkl") # Load "model_columns.pkl"print ('Model columns loaded')app.run(host='0.0.0.0', port=port, debug=True)
在设置 app.run(host='0.0.0.0', port=port, debug=True)
时,将 host
参数设置为 0.0.0.0
意味着Web服务器将监听所有网络接口的连接,而不是仅监听本地接口。这使得服务器可以从网络上的任何地方访问,包括其他计算机或设备。这种设置通常用于测试和开发环境中,方便在不同设备上进行测试和访问。
具体来说,0.0.0.0
是一个特殊的IP地址,代表“所有接口”。这意味着服务器将接受来自任何网络接口的连接尝试,包括本地和外部的网络接口。这在开发和测试Web应用时非常有用,因为它允许开发人员从不同的机器或浏览器上访问服务器,而无需担心特定的网络地址。
此外,使用 0.0.0.0
作为主机名还可以简化部署过程,因为它允许服务器在不同的网络环境中无需修改配置即可正常工作。例如,在云平台或虚拟机上部署应用时,0.0.0.0
可以确保服务器能够正确地绑定到所有可用的网络接口。
总结来说,将 host
设置为 0.0.0.0
是一种灵活的配置方式,它使得Web服务器能够接受来自任何网络接口的连接,从而方便开发和测试,以及在不同网络环境中的部署和访问。
先运行test.py程序,然后运行api.py程序,之后就会获得:
第二个ip地址,就可以通过外网访问
url = 'http://xxx.xxx.x.xx:12345/predict'